Após a morte de John Barnett, segundo denunciante da Boeing morre após acusar a empresa de "ignorar defeitos"
Peterson alertou sobre o seguinte.
_____________________
“Esteja preparado para coisas que surgirão na frente da IA no próximo ano e que deixarão seus cabelos em pé.
Agora já existe uma IA capaz de criar sua própria imagem do mundo apenas com base na análise de um colossal corpus de textos. E essa IA já é mais inteligente do que muitos de nós. Mas em um ano ele se tornará incomparavelmente mais inteligente do que a maioria de nós. Pois ela construirá sua imagem do mundo a partir de trilhões de padrões, extraídos não apenas dos textos das pessoas, mas também do próprio mundo (suas imagens visuais e outras). O conhecimento que está no centro da sua visão do mundo não virá apenas das estatísticas linguísticas dos textos que descrevem esse mundo (como o ChatGPT tem atualmente). Mas também das estatísticas dos padrões de formação e dinâmica das interações dos objetos neste mundo.
Portanto, mantenham seus chapéus, senhoras e senhores. Como disse Jonathan Pajo, “gigantes virão à Terra novamente, e podemos vê-los, se vivermos”.

_____________________
Menos de três meses depois, como alerta o prof. Peterson começou a se tornar realidade.
Um grupo de pesquisadores de inteligência artificial do Google e da Universidade Técnica de Berlim apresentou o primeiro passo para o que Peterson estava falando:
O PaLM-E é um modelo de linguagem visual multimodal (VLM) de 562 bilhões de parâmetros que combina visão e linguagem para controlar robôs.
Dado o comando “traga-me alguns chips de arroz da gaveta da cozinha”, o PaLM-E pode gerar um plano de ação para uma plataforma robótica móvel com braço mecânico (desenvolvido pela Google Robotics) e executar todo o conjunto de ações geradas.
O PaLM-E faz isso analisando os dados da câmera do robô sem exigir uma representação pré-renderizada da cena. Isso elimina a necessidade de pré-processamento ou anotação humana e permite que o robô trabalhe de forma autônoma.

PaLM-E é um preditor do próximo token. É assim chamado porque é baseado no Large Language Model (LLM) do Google chamado “PaLM”, semelhante à tecnologia por trás do ChatGPT.
_____________________
Mas o Google tornou o PaLM “realista” adicionando informações sensoriais e controle robótico.
Como é baseado em um modelo de linguagem, o PaLM-E coleta continuamente observações como imagens ou dados de sensores e os codifica em uma sequência de vetores do mesmo tamanho que os tokens de linguagem. Isso permite que o modelo “entenda” as informações sensoriais da mesma forma que processa a linguagem.
O novo modelo demonstra habilidades interessantes e inesperadas.
Por exemplo, exibe “transferência positiva”, o que significa que pode transferir o conhecimento e as habilidades que aprendeu de uma tarefa para outra, resultando em desempenho significativamente maior em comparação com modelos de robôs de tarefa única.
Além disso, o modelo exibe cadeias de raciocínio multimodais (permitindo que o modelo analise uma sequência de entradas que incluem informações linguísticas e visuais) e inferência multiimagem (usando várias imagens como entrada para fazer uma conclusão ou previsão), embora o modelo foi treinado apenas em prompts de imagem única.
Peterson estava certo. Mantenham seus chapéus, senhoras e senhores. Pois os gigantes já estão se aproximando.
E não esqueça: nossa página principal é atualizada diariamente, com novos artigos podendo ser publicados ao longo do dia. Clique aqui.
PARTICIPE DOS COMENTÁRIOS MAIS ABAIXO…
fronteiraxoficial@gmail.com
https://www.youtube.com/channel/UCxv4QmG_elAo7eiKJAOW7Jg
ÁREA DE COMENTÁRIOS
Atenção:
Comentários
Postar um comentário
CONTE-NOS SEU RELATO!