Descobertas escandalosas em IA! Cientistas descobriram materiais suspeitos
- Pesquisadores de Stanford descobriram imagens suspeitas no banco de dados Laion-5B
- Por exemplo, Stable Diffusion ou Imagen é construído neste banco de dados
- O banco de dados continha mais de 3.226 imagens de abuso infantil
Ainda sabemos muito pouco sobre dados de treinamento e como os modelos de IA realmente aprendem, as regulamentações ainda estão por vir e as primeiras disputas legais aconteceram há alguns meses. No entanto, o Observatório de Stanford descobriu que o banco de dados mais famoso de imagens LAION-5B, no qual a Difusão Estável foi treinada, por exemplo, contém mais de 3.226 imagens de suspeitas de atividades ilegais na forma de abuso infantil.
Os modelos generativos de IA, especialmente aqueles baseados em aprendizado de máquina e profundo, usam dados de treinamento para aprender padrões, que então usam para gerar respostas às suas perguntas. Este processo de recolha, seleção e processamento de dados é, obviamente, fundamental para um funcionamento adequado e de alta qualidade. O banco de dados Laion é uma biblioteca gigante, um índice de imagens ou textos online, e o nome é uma abreviatura da organização sem fins lucrativos Large-scale Artificial Intelligence Open Network. Esta vasta rede aberta fornece até centenas de milhões de imagens graças ao qual os modelos podem posteriormente gerar resultados fotorrealistas.
O que há de errado não apenas com o LAION, mas com toda a raspagem de nossas imagens e escritos para treinar IA.
Vamos encerrar isso.
Porque nós nos importamos. pic.twitter.com/U65VeQp5zc
- Remmelt [email protected], [email protected] (@RemmeltE) 2 de janeiro de 2024
O Grupo de Vigilância da Universidade de Stanford em colaboração com o Centro Canadense de Proteção à Criança nestes materiais identificaram material ilegal e imediatamente confrontou o criador deste banco de dados. A única declaração que recebemos dos desenvolvedores pode parecer uma admissão de culpa e é claro que eles estão trabalhando para remover os arquivos maliciosos.
A empresa possui uma política de tolerância zero com conteúdo ilegal. Trabalhamos com organizações como a IWF e outras para verificar ligações em conjuntos de dados utilizando ferramentas de filtragem desenvolvidas pela nossa comunidade e organizações parceiras para garantir a sua segurança.
A LAION tem uma política de tolerância zero para conteúdos ilegais. Trabalhamos com organizações como a IWF e outras para validar links nos conjuntos de dados LAION com ferramentas de filtragem desenvolvidas pela nossa comunidade e organizações parceiras para garantir que sejam seguros.
<h3 class="post-list__title" itemprop="headline">A Samsung está a preparar uma revolução na fotografia móvel. Os novos sensores devem ser capazes de replicar a visão humana</h3>
</article>
</div>
<p>-LAION (@laion_ai) <a rel="nofollow noopener" target="_blank" href="https://twitter.com/laion_ai/status/1737604245489418368?ref_src=twsrc%5Etfw">20 de dezembro de 2023</a></p>
</blockquote>
<p>Ainda é incerto como se desenrolará esta disputa e se terá consequências a longo prazo no controlo dos dados de formação, mas neste caso <strong>pode ser o catalisador inicial para a introdução de regulamentações e controles mais rigorosos</strong> no campo de dados de treinamento de modelos semelhantes. Muitos grupos activistas também decidiram lutar pela abolição de bases de dados semelhantes e estão a tomar medidas iniciais sob a forma de petições.</p>
<div class="video__wrap">
<div class="youtube__video" data-id="KFN07AAhdfQ">
<h3 class="youtube__title">Escândalo de IA: imagens de abuso infantil encontradas no conjunto de dados LAION-5B</h3>
<p><img decoding="async" src="https://www.svetandroida.cz/media/2024/01/ai-scandal-child-abuse-images-found-in-laion-5b-dataset-1-772x434.jpg" srcset="https://www.svetandroida.cz/media/2024/01/ai-scandal-child-abuse-images-found-in-laion-5b-dataset-1-600x338.jpg 600w, https://www.svetandroida.cz/media/2024/01/ai-scandal-child-abuse-images-found-in-laion-5b-dataset-1-772x434.jpg 772w" sizes="(max-width: 600px) 600px, (min-width: 601px) 772px" alt="Escândalo de IA: imagens de abuso infantil encontradas no conjunto de dados LAION-5B" title="Escândalo de IA: imagens de abuso infantil encontradas no conjunto de dados LAION-5B" class itemprop="image" data-type="sz_get_image_by_id_nolazy"><button class="youtube__play" title="Přehrát video AI Scandal: Child Abuse Images Found in LAION-5B Dataset"><svg xmlns="http://www.w3.org/2000/svg" width="70" height="48" fill-rule="evenodd" clip-rule="evenodd" stroke-linejoin="round" stroke-miterlimit="1.4"><path d="M17 24c0-10 8.2-18 18-18s18 8 18 18a18 18 0 0 1-36 0z" fill="#fff" fill-rule="nonzero"></path><path class="color" d="M26.3 37V11L48 24 26.3 37zM67 4.7c-2-3.4-4-4-8.2-4.2A495 495 0 0 0 35 0c-9 0-19.6.1-23.8.4C7 .6 5 1.2 3 4.6 1 8 0 13.8 0 24s1 16 3 19.3c2 3.4 4 4 8.2 4.3a576.1 0 0 0 47.6 0c4.2-.3 6.3-.9 8.2-4.3 2-3.3 3-9.1 3-19.3 0-10.2-1-16-3-19.4z" fill="#3b3b3b" fill-rule="nonzero"></path></svg></button></p>
</div>
</div>
<h2 style="text-align: center;" itemprop="headline">Você acha que haverá regulamentações sobre o treinamento de dados de IA?</h2>
<p>Fonte: Cyber.Fsi, Laion</p>