Contents

Uma abordagem futurista para regular a inteligência artificial

Os estimados membros da equipe de robótica do Google DeepMind anunciaram recentemente vários avanços inovadores em tecnologia que visam facilitar o desenvolvimento de máquinas autônomas capazes de assimilar perfeitamente os ambientes cotidianos, ao mesmo tempo que exibem maiores capacidades de tomada de decisão. Entre estas inovações notáveis ​​está um foco primordial na garantia da segurança pública através de maior acuidade perceptiva e consciência situacional por parte dos próprios robôs. Para este fim, o Google propôs uma estrutura abrangente de diretrizes denominadas coletivamente como “Constituição do Robô”, que serve como uma base indispensável para governar as interações entre humanos e sistemas de inteligência artificial.

AutoRT, modelo de aprendizagem e treinamento com uma “Constituição do robô”

AutoRT é um sistema inovador que aproveita os recursos de modelos avançados de inteligência artificial, incluindo modelos de linguagem grande e modelos de linguagem visual, para desenvolver robôs com objetivos práticos semelhantes aos humanos. Ao combinar esses modelos com um modelo de controle de robô, como os desenvolvidos pelo Google, o AutoRT cria um sistema poderoso capaz de controlar vários robôs equipados com câmeras e atuadores. Esses robôs são então utilizados para coletar dados de treinamento em novos ambientes, com cada robô atribuindo funções específicas com base em suas capacidades. Por exemplo, um VLM pode ser empregado para entender o entorno do robô, enquanto um LLM lida com tarefas mais complexas, como “colocar o café na mesa”.

/images/5124_auto-rt_environment.jpg Os diferentes ambientes de teste do Auto-RT

Durante uma fase de avaliação prolongada que durou vários meses, a nossa plataforma orientada por IA demonstrou a sua proficiência na orquestração de até vinte máquinas autónomas de uma só vez, ao mesmo tempo que envolveu até cinquenta e duas entidades robóticas distintas em geral, numa vasta gama de ambientes de trabalho dentro das nossas instalações.. Esta avaliação abrangente envolveu mais de setenta e sete mil testes individuais, abrangendo uma série de tarefas complexas executadas pelos robôs participantes em seiscentas e sessenta e seis ocasiões distintas.

O AutoRT serve tanto como uma plataforma elementar de aquisição de dados quanto como uma ilustração preliminar de como os sistemas robóticos autônomos podem ser perfeitamente assimilados pela realidade da existência diária. Para que ocorra uma implementação tão extensiva e uma integração de rotina, é imperativo que estas tecnologias sejam avançadas através de investigação rigorosa e cultivadas com o máximo respeito pela segurança quando encontram interação humana.

/images/everydayrobot_720.jpg

No domínio das relações homem-robô, os devotos da literatura de ficção científica não podem deixar de contemplar o trio de princípios que regem a conduta dos robôs, conhecidos como as Três Leis da Robótica, idealizados por Isaac Asimov através das suas narrativas que apresentam renomadas máquinas positrônicas como personagens centrais. Estes princípios, codificados no “cérebro positrónico” dos robôs, formam a base para as suas ações e ligações interpessoais com os humanos, servindo como pedra angular da paisagem científica ficcional de Asimov.

-Um robô não pode prejudicar um ser humano nem pode permitir que, por não intervir, um ser humano sofra danos. -Um robô deve obedecer a ordens dadas por humanos, desde que tais ordens não entrem em conflito com a Primeira Lei. -Um robô deve proteger a sua existência, desde que a proteja de que não entre em conflito com a Primeira ou a Segunda Lei.

Através de adaptações inspiradas das Três Leis da Robótica de Asimov, a divisão de robótica do Google DeepMind elaborou uma “Constituição Ética para Robôs”, que serve como um conjunto de diretrizes para garantir que agentes autônomos como o AutoRT priorizem a segurança ao selecionar tarefas que envolvem interações com humanos, animais, equipamentos elétricos. dispositivos e outros perigos potenciais. Isto inclui medidas de precaução derivadas de práticas robóticas convencionais, como a interrupção automatizada de processos operacionais se for detectada tensão excessiva nas articulações do robô. Aliado a isso, todos os testes experimentais realizados pela equipe do Google contaram com monitoramento constante por um operador humano dotado da capacidade de desativar as máquinas sempre que necessário.

SARA-RT, mais eficiência para modelos de controle robótico

A equipe DeepMind introduziu uma nova abordagem conhecida como Atenção Robusta Auto-Adaptiva para Transformadores Robóticos (SARA-RT), que aumenta a eficiência dos modelos de Transformadores Robóticos utilizados pelo Google em seus sistemas de controle robótico mais recentes. Esta tecnologia demonstrou um aumento impressionante de 10,6% na precisão e uma redução notável de 14% no tempo de processamento quando comparada aos modelos RT-2, após a exposição a um breve conjunto de recursos visuais especializados.

Os modelos de transformadores possuem um potencial formidável; no entanto, necessitam de recursos computacionais substanciais, o que pode potencialmente impedir a rápida tomada de decisões. A crescente complexidade desses modelos, caracterizada pela escala cúbica, impõe um imperativo para aumentos exponenciais nas capacidades de processamento para manter um desempenho consistente. Especificamente, à medida que o tamanho dos inputs aumenta, exige um aumento incremental da eficiência computacional por um factor de quatro, o que possivelmente prolonga o processo de tomada de decisão.

Através da utilização de uma abordagem de ajuste inovadora denominada “up-training”, os pesquisadores da DeepMind aproveitaram com sucesso o potencial da complexidade quadrática, transformando-a em complexidade linear, aumentando assim a eficiência do modelo inicial, mantendo ao mesmo tempo seu desempenho geral. Este avanço marca a inauguração do SARA-RT como o primeiro mecanismo de atenção escalonável que oferece melhorias computacionais sem comprometer a qualidade e é aplicável a uma ampla gama de modelos simples de Transformer que não requerem código suplementar.

RT-Trajetória, traçados bidimensionais para tarefas de aprendizagem generalizadas

Concluindo, a equipe da DeepMind apresentou o RT-Trajectory, que incorpora contornos visuais bidimensionais para representar o movimento e os apêndices dos robôs em vídeos de treinamento. Esta abordagem inovadora envolve a sobreposição de cada vídeo de um determinado conjunto de dados no ambiente virtual correspondente, capturando assim as trajetórias únicas associadas a atividades específicas realizadas pelo robô, como navegar através de obstáculos ou manipular objetos. Estas ações podem parecer uma segunda natureza para os humanos, mas podem ser traduzidas em numerosos métodos alternativos quando executadas por um robô, sublinhando o valor desta metodologia inovadora.

Na metodologia convencional, a educação de um canino robótico segue uma abordagem em que comandos abstratos de linguagem natural, como “limpar a mesa”, são traduzidos em uma sequência de movimentos precisos, dificultando a capacidade dos modelos de inteligência artificial de generalizar e se adaptar a novas situações. As trajetórias representadas pela estrutura RT-Trajetória fornecem um conjunto de dicas visuais práticas e de baixo nível que facilitam o processo de aprendizagem de políticas de controle robótico, permitindo que modelos de IA compreendam e repliquem as ações físicas observadas em vídeos. Essencialmente, a RT-Trajetória permite que modelos Robóticos Temporais (RT) captem a execução de atividades por meio da interpretação dos movimentos do robô capturados em filme.

/images/5123_rt-trajectory.gif

Os investigadores realizaram uma avaliação da trajetória RT em quarenta e uma tarefas que não foram incluídas no conjunto de dados de treinamento. Durante esta avaliação, eles observaram a execução de um braço robótico utilizando este modelo e descobriram que ele exibiu um desempenho significativamente melhorado em comparação com os tempos de resposta (RTs) dos modelos existentes, com uma taxa de conclusão de 63% para a execução bem-sucedida da tarefa, o que é quase o dobro dos 29% alcançados pelo RT-2.

A natureza versátil do modelo RT-Trajetória permite que ele seja facilmente integrado a vários sistemas robóticos, permitindo aos usuários criar caminhos e padrões de movimento através da observação de demonstrações humanas ou de pistas visuais fornecidas na forma de desenhos.

Provavelmente ainda levará algum tempo até que vejamos na vida cotidiana robôs capazes de realizar diferentes tarefas que são banais para os humanos, ou talvez verdadeiros mordomos robóticos. Mas o que o Google apresentou nos últimos dias pode ser plenamente considerado como uma peça fundamental para o desenvolvimento e implementação de sistemas robóticos mais complexos, capazes de ajudar os humanos no trabalho e nas atividades pessoais.

*️⃣ Link da fonte:

revelou algumas atualizações tecnológicas importantes , AutoRT , Atenção robusta autoadaptativa para transformadores robóticos , Trajetória RT ,