Os carros do futuro serão mais do que apenas meios de transporte; eles serão companheiros inteligentes, combinando perfeitamente tecnologia e conforto para aprimorarem as experiências de direção, além de serem construídos para segurança, por dentro e por fora.
O NVIDIA GTC, realizado esta semana no San Jose Convention Center, destaca o trabalho inovador que a NVIDIA e seus parceiros estão realizando para levar o poder transformador da IA generativa, dos grandes modelos de linguagem (LLMs) e dos modelos de linguagem de visão para o setor de mobilidade.
Em seu estande, a NVIDIA mostra como está criando assistentes automotivos para melhorar a segurança e o conforto do motorista por meio de percepção aprimorada, compreensão e capacidades generativas alimentadas por deep learning e modelos transformadores.
Falando sobre o assunto
Os grandes modelos de linguagem (LLMs), uma forma de IA generativa, representam em grande parte uma classe de arquiteturas de deep learning conhecidas como modelos transformadores, que são redes neurais prontas para captarem o contexto e o significado da aprendizagem.
Os modelos de linguagem de visão são outro derivado da IA generativa que oferecem recursos de processamento de imagens e compreensão de linguagem. Ao contrário dos grandes modelos de linguagem (LLMs) tradicionais ou multimodais que processam e geram principalmente dados baseados em texto, os modelos de linguagem de visão (VLMs) podem analisar e gerar texto por meio de imagens ou vídeos.
E a geração aumentada por recuperação permite que os fabricantes acessem o conhecimento de um banco de dados específico ou da web para auxiliar os motoristas.
Juntas, essas tecnologias permitem que o NVIDIA Avatar Cloud Engine, ou ACE, e modelos de linguagem multimodais trabalhem em conjunto com a plataforma NVIDIA DRIVE para permitir que os fabricantes automotivos desenvolvam seus próprios assistentes inteligentes incorporados ao carro.
Por exemplo, um configurador Avatar pode permitir que os designers criem personas únicas e inspiradas na marca para seus carros, completas com vozes personalizadas e atributos emocionais. Esses avatares animados por IA podem iniciar um diálogo natural, fornecendo assistência em tempo real, recomendações e interações personalizadas.
Além disso, a visualização surround aprimorada por IA aumenta a segurança do veículo usando a reconstrução da câmera em 360 graus, enquanto o assistente inteligente obtém informações externas, como leis de trânsito locais, para informar a tomada de decisões.
A personalização é fundamental, com os assistentes de IA aprendendo os hábitos do condutor e dos passageiros e adaptando o seu comportamento para atender às necessidades dos ocupantes.