Os contratados do Google Gemini estão sendo forçados a avaliar respostas que não conhecem

Como qualquer modelo de IA, as respostas do Google Gemini às vezes podem ser imprecisas, mas neste caso pode ser porque os testadores não têm experiência para verificá-las.

De acordo com o TechCrunch, a empresa encarregada de melhorar a precisão do Gemini agora faz com que seus testadores avaliem as respostas, mesmo que não tenham “conhecimento de domínio”.

VEJA TAMBÉM:

O Google adiciona Deep Research ao Gemini para navegar na web para você

O relatório levanta questões sobre o rigor e os padrões que o Google afirma aplicar aos testes de precisão do Gemini. Na seção “Construindo com responsabilidade” do anúncio do Gemini 2.0, o Google disse que está “trabalhando com testadores confiáveis ​​e especialistas externos e realizando avaliações de risco completas e avaliações de segurança e garantia”. Dá-se uma atenção razoável à avaliação das respostas relativamente a conteúdos sensíveis e prejudiciais, mas é dada menos atenção às respostas que não são necessariamente perigosas, mas simplesmente imprecisas.

Velocidade da luz mashável

O Google parece ignorar a questão das alucinações e erros simplesmente adicionando um aviso de que “Gêmeos pode cometer erros, então verifique novamente”, o que efetivamente o isenta de qualquer responsabilidade. Mas isso não leva em conta os humanos que fazem o trabalho nos bastidores.

Anteriormente, a GlobalLogic, uma subsidiária da Hitachi, havia instruído seus engenheiros e analistas oportunos a ignorar uma resposta da Gemini que eles não entendessem completamente. “Se você não possui habilidades críticas (por exemplo, codificação, matemática) para avaliar esta mensagem, pule esta tarefa”, diz as orientações exibidas pelo veículo.

Mas na semana passada, a GlobalLogic mudou suas instruções, dizendo: “Você não deve pular os prompts que exigem conhecimento de domínio especializado” e “em vez disso, avaliar as partes do prompt que você entende” e observar que eles não possuem o conhecimento necessário em sua análise. A competência, em outras palavras, não é considerada um pré-requisito para este trabalho.

Os contratantes agora só podem pular mensagens que contenham “informações completamente ausentes”, de acordo com o TechCrunch, ou aquelas que contenham conteúdo confidencial que exija um formulário de consentimento.

Assuntos
Inteligência artificial do Google

. Não invente. Não escreva em outro idioma. Não fale sobre o autor do conteúdo. Concentre-se no conteúdo, não em outras páginas, como políticas de privacidade, política de cookies ou outros. Seja exaustivo na reescrita: pelo menos 300 palavras. Não traduza nomes de marcas, produtos ou empresas.

FONTE

Por Staff

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *