Um dos maiores desafios que envolvem inteligência artificial chama-se processamento natural da linguagem. O problema torna-se ainda maior quando se trata da língua portuguesa. Por serem poucos os países que adotam esse idioma como oficial e ainda por causa da grande complexidade nas conjugações dos verbos, entre outras coisas, bases de dados que possam ser usadas como experiência na aprendizagem de máquina são o grande gargalo da área.
Lembrando que a aprendizagem é fornecida através da experiência, um grande conjunto de textos, e acima de tudo, diversidade deles, é essencial para “ensinar” à máquina a interagir com humanos se passando por um deles. Não esquecendo que a máquina precisa aprender ainda sinônimos, abreviações, regionalismos e os neologismos crescentes na readaptação e construção frequente da língua.
Samuel Pordeus, graduado em Engenharia da Computação desenvolveu seu TCC, com o objetivo de criar modelos conversacionais com diferentes personalidades. Foi implementado um agente inteligente utilizando deep learning, e duas instâncias foram treinadas, a primeira alimentada por uma base de dados com 15.000 filmes de comédia e a segunda pela mesma quantidade, porém de filmes de terror. Após o treinamento, os modelos neurais conversacionais responderam uma série de perguntas genéricas e com um questionário, separado em diversos trechos, foi solicitado aos participantes para determinarem se as sentenças aparentavam ser produzidas por humanos e se as respostas remetiam aos gêneros de comédia e terror, ou nenhum dos dois. Mais da metade dos participantes consideraram a procedência das respostas produzidas pelo chatbot como humanas e a taxa de acerto de gênero de filme foi superior à de erro em todos os oito trechos de diálogos.
A ideia é que a máquina aprenda o padrão no discurso a partir da frequência, percebendo que palavras surgem próximas umas das outras e associando perguntas (e isso é mais fácil de controlar por causa da presença do símbolo da interrogação) com suas respostas (que vem logo em seguida a esse símbolo). Parâmetros inerentes ao método envolvem ainda tamanho do vocabulário, tamanho das sentenças a serem consideradas na busca do padrão, entre outros já clássicos da arquitetura de rede neural (e deep learning).
Atualmente, os desenvolvedores e pesquisadores de chatbots preocupam-se quase exclusivamente com a geração e interpretação textual por parte destes. E isso já é uma tarefa extremamente complexa. À medida em que mais aplicações envolvendo chatbots surgem, cresce a necessidade em poder atribuí-los agora uma personalidade. Como fazer uma máquina entender o sarcasmo, por exemplo.
Trecho de um diálogo com a máquina:
Humano: Oi! Chatbot: Oi! Humano: Qual o seu nome? Chatbot: Henry. Humano: Você está consciente? Chatbot: Louca! Humano: Como é? Chatbot: Você é minha. Humano: Eu vou te matar! Chatbot: Vou pegar você!
O diálogo parecer ser entre duas pessoas? A rede foi treinada com que gênero? Terror ou comédia?