Palestrante

Claudio Pinhanez
IBM Research - Brasil
Fomentando o Uso de Línguas Indígenas no Mundo Digital: Experiências com Processos de Co-Desenvolvimento Ético
Será que ferramentas digitais, e baseadas em IA, podem ser usadas para fomentar o uso línguas indígenas que estão em perigo de desaparecer? Nesta palestra descrevo a trajetória do projeto PROLIND, realizado pela IBM Research Brasil e pela Universidade de São Paulo, apresentando o processo de construção de ferramentas, feito em um processo de co-desenvolvimento com comunidades indígenas, visando o estímulo e a facilitação da escrita, e usando modelos LLM para criar corretores ortográficos, preditores de próxima palavra e dicionários.
Com base nesses processos, são discutidas questões éticas e de engajamento com as comunidades e as pessoas indígenas, bem como questões específicas de um processo de co-design trans-cultural. Também exploro alguns desafios no desenvolvimento de tradutores de alta qualidade para línguas indígenas por meio do fine-tuning de tradutores automáticos com minúsculas quantidades de dados, discutindo as questões de propriedade intelectual envolvidas. Por fim, apresento um futuro para a documentação em que línguas em vias de desaparecer são preservadas como modelos de linguagem interativos.