Em seu Relatório de transparência de IA responsável, que cobre principalmente 2023, a Microsoft elogia suas conquistas na implantação segura de produtos de IA. O relatório anual de transparência da IA é um dos compromissos assumidos pela empresa após assinar um acordo voluntário com a Casa Branca em julho do ano passado. A Microsoft e outras empresas prometeram estabelecer sistemas de IA responsáveis e comprometer-se com a segurança.
A Microsoft afirma no relatório que criou 30 ferramentas de IA responsável no ano passado, aumentou sua equipe de IA responsável e exigiu que equipes que criassem aplicativos generativos de IA medissem e mapeassem riscos ao longo do ciclo de desenvolvimento. A empresa observa que adicionou credenciais de conteúdo às suas plataformas de geração de imagens, que colocam uma marca d’água em uma foto, marcando-a como feita por um modelo de IA.
A empresa afirma que deu aos clientes do Azure AI acesso a ferramentas que detectam conteúdo problemático, como discurso de ódio, conteúdo sexual e automutilação, bem como ferramentas para avaliar riscos de segurança. Isso inclui novos métodos de detecção de jailbreak, que foram expandidos em março deste ano para incluir injeções indiretas imediatas, onde as instruções maliciosas fazem parte dos dados ingeridos pelo modelo de IA.
Também está expandindo seu equipe vermelha esforços, incluindo equipes vermelhas internas que tentam deliberadamente ignorar os recursos de segurança em seus modelos de IA, bem como aplicativos de equipes vermelhas para permitir testes de terceiros antes de lançar novos modelos.
No entanto, suas unidades da equipe vermelha têm um trabalho difícil para eles. Os lançamentos de IA da empresa não ficaram imunes a controvérsias.
Natasha Crampton, diretora responsável de IA da Microsoft, disse em um e-mail enviado para A beira que a empresa entenda que a IA ainda é um trabalho em andamento, assim como a IA responsável.
“A IA responsável não tem linha de chegada, portanto nunca consideraremos nosso trabalho cumprido no âmbito dos compromissos de IA voluntária. Mas fizemos grandes progressos desde a assinatura dos acordos e esperamos aproveitar o nosso impulso este ano”, afirma Crampton.