Ao ler o artigo recente de Joe Dolson sobre a interseção entre IA e acessibilidade, apreciei absolutamente o ceticismo que ele tem em relação à IA em geral e às maneiras como muitos a utilizam. Na verdade, sou muito cético em relação à IA, apesar de meu papel na Microsoft como estrategista de inovação em acessibilidade que ajuda a liderar o programa de subsídios AI para Acessibilidade. Como qualquer outra ferramenta, a IA pode ser utilizada de uma forma muito construtiva, inclusiva e acessível; e pode ser usado de forma destrutiva, exclusiva e prejudicial. E há muito uso em algum lugar no meio.
O artigo continua abaixo
Gostaria que você considerasse este um artigo do tipo “sim… e” para complementar a postagem de Joe. Não estou tentando refutar nada do que ele diz, mas sim dar visibilidade a projetos e oportunidades onde a IA pode fazer mudanças significativas para pessoas com deficiência. Para ser claro, não estou dizendo que não existam riscos reais ou problemas urgentes com a IA que precisem ser abordados – existem, e tivemos que resolvê-los, tipo, ontem – mas quero dedicar algum tempo para falar sobre o que é possível, na esperança de que um dia cheguemos lá.
O artigo de Joe passa muito tempo falando sobre modelos de visão computacional que geram texto alternativo. Ele aponta uma série de problemas válidos com o estado atual das coisas. E embora os modelos de visão computacional continuem a melhorar a qualidade e a riqueza de detalhes em suas descrições, seus resultados não são bons. Como ele correctamente salienta, o estado actual da análise de imagens é bastante fraco – especialmente para certos tipos de imagens – em grande parte porque os actuais sistemas de IA examinam imagens isoladamente e não dentro do contexto em que se encontram (uma consequência de terem modelos “subjacentes” separados para análise de texto e análise de imagens). Os modelos atuais não são treinados para distinguir entre imagens que são contextualmente relevantes (que provavelmente deveriam ter descrições) e aquelas que são puramente decorativas (que podem não precisar de descrição). No entanto, ainda acho que há potencial neste espaço.
Como Joe menciona, a criação de texto alternativo por pessoas no loop deveria ser absolutamente uma coisa. E se a IA puder intervir e oferecer um ponto de partida para o texto alternativo, mesmo que esse ponto de partida possa ser um ditado rápido O que é isso? Isso não está nada certo… Deixe-me tentar oferecer um ponto de partida— Acho que é uma vitória.
Indo um passo adiante, se pudermos treinar especificamente um modelo para analisar o uso de uma imagem no contexto, isso poderá nos ajudar a identificar mais rapidamente quais imagens provavelmente serão decorativas e quais provavelmente exigirão descrição. Isso ajudará a determinar quais contextos exigem descrições de imagens e isso melhorará a eficiência dos autores em tornar seus sites mais acessíveis.
Embora imagens complexas – como gráficos e diagramas – sejam difíceis de descrever de forma concisa (mesmo para humanos), a imagem de exemplo compartilhada na postagem do GPT4 também aponta para uma oportunidade interessante. Suponha que você encontre um gráfico cuja descrição seja simplesmente o título do gráfico e o tipo de visualização, como: Um gráfico de pizza comparando o uso de smartphones com o uso de feature phones entre famílias nos EUA que ganham menos de US$ 30.000 por ano. (Isso seria um texto alternativo terrível para um gráfico porque deixaria muitas perguntas sobre os dados sem resposta, mas, novamente, vamos supor que essa era a descrição que estava em vigor.) Se o seu navegador soubesse que a imagem era um gráfico de pizza (porque o modelo integrado deduziu isso), imagine um mundo onde os usuários pudessem fazer perguntas como estas sobre o gráfico:
- Mais pessoas estão usando smartphones ou feature phones?
- Quanto mais?
- Existe um grupo de pessoas que não se enquadra em nenhum desses grupos?
- Quantos são isso?
Deixando de lado a realidade das alucinações do modelo de linguagem grande (LLM) – onde o modelo apenas inventa “factos” que parecem plausíveis – por um momento, a oportunidade de aprender mais sobre imagens e dados desta forma poderia ser revolucionária para pessoas cegas e com visão parcial, bem como para pessoas com várias formas de daltonismo, deficiências cognitivas, e assim por diante. Também poderia ser útil num contexto educacional para ajudar pessoas que pode visualize esses gráficos como eles são para compreender os dados nos gráficos.
Vamos dar um passo adiante: e se você pudesse pedir ao seu navegador para simplificar um gráfico complexo? E se você pudesse pedir para isolar uma única linha em um gráfico de linhas? E se você pudesse pedir ao seu navegador para transpor as cores de diferentes linhas para funcionar melhor de acordo com o seu tipo de daltonismo? E se você pudesse pedir a ele para substituir cores por padrões? Dadas as interfaces baseadas em bate-papo dessas ferramentas e nossa capacidade existente de manipular imagens nas ferramentas de IA atuais, isso parece uma possibilidade.
Agora imagine um modelo criado especificamente para extrair as informações desse gráfico e convertê-las em outro formato. Por exemplo, talvez você possa converter aquele gráfico de pizza (ou melhor ainda, uma série de gráficos de pizza) em formatos mais acessíveis (e úteis), como planilhas. Isso seria incrível!
Algoritmos de empilhamento#seção 3
Safiya Umoja Noble acertou em cheio quando intitulou seu livro Algoritmos de opressão. Embora o seu livro se concentre nas formas como os motores de busca reforçam o racismo, penso que é igualmente verdade que todos os modelos informáticos têm o potencial de amplificar conflitos, preconceitos e intolerância. Quer o Twitter esteja sempre mostrando o último tweet de um bilionário entediado, o YouTube esteja nos mandando para o buraco Q ou o Instagram esteja distorcendo nossas ideias sobre a aparência dos corpos naturais, sabemos que algoritmos mal criados e mantidos são incrivelmente prejudiciais. Muito disso decorre da falta de diversidade entre as pessoas que os moldam e constroem. No entanto, quando estas plataformas são construídas com inclusão inclusiva, existe um potencial real para desenvolver algoritmos para ajudar pessoas com deficiência.
Veja o Mentra, por exemplo. Eles são uma rede de emprego para pessoas neurodivergentes. Eles usam um algoritmo para combinar candidatos a emprego com potenciais empregadores com base em mais de 75 pontos de dados. Quanto aos candidatos a emprego, são tidos em conta os pontos fortes de cada candidato, as suas adaptações necessárias e desejadas no local de trabalho, as sensibilidades ambientais, etc. Do lado do empregador, ele considera cada ambiente de trabalho, fatores de comunicação relacionados a cada trabalho e assim por diante. Como empresa dirigida por pessoas neurodivergentes, a Mentra tomou a decisão de mudar o cenário no que diz respeito aos locais de trabalho típicos. Eles usam seu algoritmo para sugerir candidatos disponíveis às empresas, que podem então se conectar com os candidatos a emprego nos quais estão interessados; reduzindo o trabalho emocional e físico no lado da procura de emprego.
Quando mais pessoas com deficiência estão envolvidas na criação de algoritmos, isso pode reduzir as chances de esses algoritmos prejudicarem as suas comunidades. É por isso que equipes diversas são tão importantes.
Imagine se o mecanismo de recomendação de uma empresa de mídia social fosse ajustado para analisar quem você segue e para priorizar recomendações a seguir para pessoas que discutiram coisas semelhantes, mas diferem em alguns aspectos importantes da sua esfera de influência existente. Por exemplo, se você seguisse um grupo de acadêmicos brancos sem deficiência falando sobre IA, isso poderia sugerir que você seguisse acadêmicos deficientes, não-brancos ou não-homens que também estão falando sobre IA. Se você seguir suas recomendações, poderá obter uma compreensão mais holística e diferenciada do que está acontecendo no campo da inteligência artificial. Estes mesmos sistemas também devem utilizar a sua compreensão dos preconceitos sobre certas comunidades – incluindo, por exemplo, a comunidade de deficientes – para garantir que não recomendam que nenhum dos seus utilizadores siga contas que perpetuem o preconceito contra (ou, pior, espalhem o ódio contra) esses grupos.
Outras maneiras pelas quais a IA pode ajudar pessoas com deficiência#seção 4
Se eu não estivesse tentando encaixar isso entre outras tarefas, tenho certeza que poderia continuar para sempre, fornecendo todos os tipos de exemplos de como a IA pode ser usada para ajudar pessoas com deficiência, mas vou transformar esta última seção em uma rodada relâmpago. Sem nenhuma ordem específica:
- Preservação da voz. Você pode ter visto o artigo VALL-E ou o anúncio do Dia Global de Conscientização sobre Acessibilidade da Apple, ou pode estar familiarizado com as ofertas de preservação de voz da Microsoft, Acapela ou outros. É possível treinar um modelo de IA para replicar sua voz, o que pode ser um grande benefício para pessoas que têm ELA (doença de Lou Gehrig) ou doença do neurônio motor ou outras condições médicas que podem levar à incapacidade de falar. É claro que esta é a mesma tecnologia que também pode ser usada para criar deepfakes sônicos, então é algo que precisamos abordar com responsabilidademas a tecnologia tem um potencial verdadeiramente transformador.
- Reconhecimento de voz. Pesquisadores como os do Speech Accessibility Project pagam pessoas com deficiência para ajudá-las a coletar gravações de pessoas com fala atípica. Enquanto digito, eles estão recrutando ativamente pessoas com Parkinson e doenças relacionadas, e planejam expandir isso para outras doenças à medida que o projeto avança. Esta investigação resultará em conjuntos de dados mais inclusivos que permitirão que mais pessoas com deficiência utilizem assistentes de voz, software de ditado e serviços de resposta de voz, e controlem mais facilmente os seus computadores e outros dispositivos utilizando apenas a voz.
- Transformação de texto. A atual geração de LLMs é perfeitamente capaz de adaptar o conteúdo textual existente sem inserir alucinações. Isto é extremamente fortalecedor para pessoas com deficiências cognitivas que poderiam beneficiar de resumos de texto ou versões simplificadas de texto ou mesmo de texto preparado para leitura biónica.
A importância de equipes e dados diversos#seção 5
Devemos reconhecer que nossas diferenças são importantes. Nossas experiências vividas são influenciadas pelas interseções de identidades nas quais existimos. Essas experiências vividas – com todas as suas complexidades (e alegrias e dores) – são contributos valiosos para o software, os serviços e as sociedades que moldamos. As nossas diferenças devem ser representadas nos dados que utilizamos para treinar novos modelos, e as pessoas que contribuem com essas informações valiosas devem ser compensadas por partilhá-las connosco. Conjuntos de dados inclusivos produzem modelos mais robustos que incentivam resultados mais equitativos.
Você quer um modelo que não humilhe, condescenda ou objetifique as pessoas com deficiência? Certifique-se de ter conteúdo sobre deficiência de autoria de pessoas com diversas deficiências e certifique-se de que isso esteja bem representado nos dados de treinamento.
Quer um modelo que não use linguagem adequada? Você pode usar conjuntos de dados existentes para criar um filtro que possa interceptar e corrigir linguagem adequada antes que ela chegue ao leitor. Dito isso, quando se trata de sensibilidade de leitura, os modelos de IA não substituirão os editores humanos tão cedo.
Quer um copiloto de codificação que forneça recomendações acessíveis instantaneamente? Pratique no código que você sabe que está disponível.
Não tenho dúvidas de que a inteligência artificial pode e irá prejudicar as pessoas… hoje, amanhã e no futuro distante. Mas também acredito que podemos reconhecer isto e, tendo em vista a acessibilidade (e, mais amplamente, a inclusão), fazer mudanças ponderadas, ponderadas e intencionais nas nossas abordagens à IA que também reduzirão os danos ao longo do tempo. Hoje, amanhã e no futuro distante.
Muito obrigado a Kartik Sawhney por me ajudar a desenvolver este artigo, a Ashley Bischoff por sua inestimável assistência editorial e, claro, a Joe Dolson pela rapidez.
Credit Post By: by