O Facebook está investigando sistemas de inteligência artificial que veem, ouvem e lembram de tudo que você faz

O Facebook está gastando muito tempo e dinheiro em realidade aumentada, incluindo a construção de seu próprio Óculos de realidade aumentada com Ray-Ban. No momento, esses dispositivos só podem gravar e compartilhar imagens, mas para que a empresa acha que esses dispositivos serão usados ​​no futuro?

PARA novo projeto de pesquisa liderado pela equipe de inteligência artificial do Facebook sugere o escopo das ambições da empresa. Imagine sistemas de inteligência artificial que analisam constantemente a vida das pessoas usando vídeos em primeira pessoa; registre o que eles veem, fazem e ouvem para ajudá-los nas tarefas diárias. Os pesquisadores do Facebook delinearam uma série de habilidades que desejam que esses sistemas desenvolvam, incluindo “memória episódica” (respondendo a perguntas como “onde deixei minhas chaves?”) E “diarização audiovisual” (lembrar quem disse o quê e quando).

No momento, as tarefas descritas acima não podem ser realizadas de forma confiável com nenhum sistema de inteligência artificial, e o Facebook enfatiza que este é um projeto de pesquisa, e não um desenvolvimento comercial. No entanto, está claro que a empresa vê recursos como esses como o futuro da computação de RA. “Definitivamente pensando em realidade aumentada e o que gostaríamos de fazer com ela, há possibilidades no futuro de tirarmos proveito desse tipo de pesquisa”, disse a pesquisadora de inteligência artificial do Facebook Kristen Grauman. A beira.

Essas ambições têm enormes implicações para a privacidade. Especialistas em privacidade já estão preocupados sobre como os óculos AR do Facebook permitem que os usuários gravem secretamente membros do público. Essas preocupações só se agravarão se as futuras versões do hardware não apenas registrar as imagens, mas também analisá-las e transcrevê-las, transformando os usuários em máquinas de vigilância itinerantes.

O primeiro par de óculos AR comerciais do Facebook só pode gravar e compartilhar vídeos e imagens, não analisá-los.
Foto de Amanda Lopez para The Verge

O nome do projeto de pesquisa do Facebook é Ego4D, que se refere à análise de vídeo em primeira pessoa ou “egocêntrica”. Ele consiste em dois componentes principais: um conjunto de dados de vídeo egocêntrico aberto e uma série de benchmarks que o Facebook acredita que os sistemas de inteligência artificial devem ser capazes de abordar no futuro.

O conjunto de dados é o maior desse tipo já criado, e o Facebook fez parceria com 13 universidades ao redor do mundo para coletar os dados. No total, 855 participantes que vivem em nove países diferentes filmaram cerca de 3.205 horas de filmagem. As universidades, ao invés do Facebook, foram responsáveis ​​pela coleta dos dados. Os participantes, alguns dos quais receberam pagamento, usaram câmeras GoPro e óculos AR para gravar vídeos de atividades improvisadas. Isso varia de trabalhos de construção a panificação, brincar com animais de estimação e socializar com amigos. Todas as imagens foram desidentificadas pelas universidades, o que incluiu borrar os rostos dos transeuntes e remover todas as informações de identificação pessoal.

Grauman diz que o conjunto de dados é “o primeiro de seu tipo em escala e diversidade”. O projeto comparável mais próximo, diz ela, contém 100 horas de filmagem na primeira pessoa filmado inteiramente em cozinhas. “Abrimos os olhos desses sistemas de IA para mais do que apenas cozinhas no Reino Unido e na Sicília, mas [to footage from] Arábia Saudita, Tóquio, Los Angeles e Colômbia “.

O segundo componente do Ego4D é uma série de benchmarks, ou tarefas, que o Facebook quer que pesquisadores de todo o mundo tentem resolver usando sistemas de inteligência artificial treinados em seu conjunto de dados. A empresa os descreve como:

Memória episódica: O que aconteceu quando (por exemplo, “Onde deixei minhas chaves?”)?

Previsão: O que devo fazer a seguir (por exemplo, “Espere, você já adicionou sal a esta receita”)?

Manipulação de mão e objeto: O que estou fazendo (por exemplo, “Ensine-me a tocar bateria”)?

Diários audiovisuais: Quem disse o quê e quando (por exemplo, “Qual foi o tópico principal da aula?”)?

Interação social: Quem interage com quem (por exemplo, “Ajude-me a ouvir melhor a pessoa que fala comigo neste restaurante barulhento”)?

No momento, os sistemas de inteligência artificial achariam extremamente difícil resolver qualquer um desses problemas, mas a criação de conjuntos de dados e benchmarks são métodos comprovados para impulsionar o desenvolvimento no campo da inteligência artificial.

Na verdade, a criação de um determinado conjunto de dados e competição anual associada, conhecido como ImageNet, costuma ser creditado com kickstarting o recente boom da IA. Os conjuntos de dados ImagetNet consistem em imagens de uma ampla variedade de objetos que os pesquisadores treinaram sistemas de inteligência artificial para identificar. Em 2012, o vencedor da competição usou um método particular de aprendizado profundo para derrotar os rivais do passado, inaugurando a era atual de investigação.

O conjunto de dados Ego4D do Facebook deve ajudar a conduzir pesquisas em sistemas de inteligência artificial que podem analisar dados na primeira pessoa.
Imagem: Facebook

O Facebook espera que seu projeto Ego4D tenha efeitos semelhantes no mundo da realidade aumentada. A empresa afirma que os sistemas treinados com Ego4D poderão um dia ser usados ​​não apenas em câmeras portáteis, mas também em robôs assistentes domésticos, que também contam com câmeras de primeira pessoa para navegar pelo mundo ao seu redor.

“O projeto tem a oportunidade de realmente catalisar o trabalho nessa área de uma forma que ainda não foi possível”, diz Grauman. “Para mover nosso campo da capacidade de analisar pilhas de fotos e vídeos que foram feitos por humanos para um propósito muito especial, para este fluxo visual de primeira pessoa fluido e contínuo que os sistemas AR, robôs, precisam entender no contexto. Da atividade . “

Embora as tarefas que o Facebook traça certamente pareçam práticas, o interesse da empresa por essa área preocupará a muitos. O recorde do Facebook sobre privacidade é péssimo, abrangendo vazamentos de dados e $ 5 bilhões em multas do FTC. É também Estado mostrando repetidamente que a empresa valoriza o crescimento e a participação acima do bem-estar dos usuários em muitos domínios. Com isso em mente, é preocupante que os benchmarks neste projeto Ego4D não incluam proteções de privacidade proeminentes. Por exemplo, a tarefa “diário audiovisual” (transcrever o que diferentes pessoas dizem) nunca menciona a exclusão de dados sobre pessoas que não desejam ser gravados.

Quando questionado sobre essas questões, um porta-voz do Facebook disse A beira Eu esperava que as proteções de privacidade fossem introduzidas mais tarde. “Esperamos que, à medida que as empresas usam esse conjunto de dados e referência para desenvolver aplicativos de negócios, elas desenvolvam proteções para esses aplicativos”, disse o porta-voz. “Por exemplo, antes que os óculos de realidade aumentada possam melhorar a voz de alguém, pode haver um protocolo em vigor para pedir permissão aos óculos de outra pessoa, ou eles podem limitar o alcance do dispositivo para que ele só possa captar os sons de pessoas com quem Já estou conversando ou quem está por perto. ”

Por enquanto, essas salvaguardas são apenas hipotéticas.

You May Also Like

About the Author: Gabriela Cerqueira

"Solucionador de problemas do mal. Amante da música. Especialista certificado em cultura pop. Organizador. Guru do álcool. Fanático por café."

Deixe um comentário

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *