Para não perder o bonde do ChatGPT

Lucia Santaella

Since its launch just two months ago, ChatGPT, from the generative AI family, is producing a high fever in culture, society and politics. Although contemporary culture, saturated with novelties and disruptions, does not cease to go from one feverish state to another, now the case is about an intelligent technology capable of dialoguing with human beings. Speech has always been the prerogative of the human animal. That an intelligence — called artificial, a robot — now starts talking is able to shake the foundations of being human. This article presents some ideas about the issue.


As tecnologias, que teimo em chamar de inteligentes, avançam a passos tão céleres que recentemente testemunhamos picos de febres midiáticas que não nos dão descanso: metaverso, então o robô falante LaMDA, que simula sentir, e agora o robô dialogante, ChatGPT que está provocando um verdadeiro delírio interpretativo e opinativo. Como se estivesse antecipando essa febre que não tem mais do que um mês (o chat foi lançado em dezembro-2022 e, na sua primeira semana, foi experimentado por mais de um milhão de pessoas!), no meu livro A inteligência artificial é inteligente? que está saindo do forno da Ed. Almedina, já poderava:

Não é por acaso que a visão cultural da IA oscile entre os extremos do entusiasmo e dos temores, ambos desmedidos. De fato, atividades há pouco tempo reservadas à inteligência humana, tais como compor textos ou analisar o conteúdo de imagens, agora são frequentemente executadas por máquinas, graças ao poder adquirido pelos algoritmos. Contudo, os efeitos que isso tem provocado nas pessoas está mais perto da fantasia do que da realidade. Reduzir o poder das fantasias infundadas está entre os principais objetivos deste livro que pretende funcionar como um convite para que observemos a IA mais de perto.

Neste breve artigo, pretendo também cumprir o que lá pretendia, ou seja, no caso agora, ver o ChatGPT mais de perto, longe dos alaridos das opiniões desenraizadas. Antes de tudo faço duas sugestões:

  1. Evitar os ressentimentos antropocêntricos contra a IA, visto que ela é alimentada por dados humanos, esses dados são selecionados e até higienizados por humanos, os algoritmos são treinados por humanos (é certo que, a partir daí, os algoritmos ganham certa vida própria e passam a aprender, mas podem ainda passar pela curadoria humana). Moral da história: há aí um cordão umbilical que não pode ser cortado. Diferente do cordão umbilical biológico que, uma vez cortado, libera uma outra vida, a inteligência humana e a IA vivem em simbiose. Ambas inteligentes, mas de modo muitíssimo diferente.
  2. Controlar os preconceitos ideológicos que oscilam entre os extremos da ingenuidade eufórica e do moralismo cético. Se esses extremos não forem controlados, ficam fechadas as portas do caminho a ser seguido: buscar conhecer e compreender para poder avaliar, com saudável e ponderada desconfiança, os impactos e consequências.

Há quase cinco anos, quando textos sobre a IA começavam a borbulhar em artigos, colunas, posts e mensagens corridas nas redes, terminei um artigo, também breve, com a seguinte conclusão: “Preparem os seus corações, pois a IA veio para ficar, crescer e se multiplicar” (https://transobjeto.wordpress.com/2018/05/19/a-ia-veio-para-ficar-crescer-e-se-multiplicar/). Não se tratava aí de adivinhação ou de visionarismo, mas sim, da convicção de que o vetor da inteligência é crescer. A inteligência é como a vida: ela não pode parar de crescer e, para isso, vai ocupando todo o espaço disponível.

A inteligência, cuja raiz encontra-se na linguagem, está no âmago do Sapiens e ela vem crescendo e se diversificando para fora do cérebro orgânico do Sapiens, nos aparelhos, dispositivos, máquinas, hoje nos computadores, seus aplicativos e plataformas (tese desenvolvida em detalhes no meu livro Neo Humano. A sétima revolução cognitiva do Sapiens – 2022), com o acento de que a inteligência é contraditória e ambivalente: pode esparramar-se pelas banalidades do mal, agudo ou disfarçado ou buscar seu destino em consonância com a dignidade ética.

O ChatGPT está provocando tanto fervor porque, em muito pouco tempo, a IA aprendeu não só a falar, mas a dialogar, em uma competição com aquilo que faz do animal humano ele ser humano. Enquanto a fala do humano tem carne, respira, pulsa e palpita, esse novo robô sustenta-se na matéria da escrita. Mas, antes da pressa da interpretação, vamos nos aproximar para conhecê-lo.

De onde vem o ChatGTP

Para evitar a ideia imediatista de que todos os hypes caem de paraquedas sabe-se lá de que céu (via de regra do céu da ignorância), justo o que vem ocorrendo com as opiniões sobre o ChatGPT, é preciso compreender que ele é bisneto da IA, neto da aprendizagem profunda e filho do processamento de linguagem natural. A pesquisa sobre IA não começou ontem. Ela já tem 70 anos, o que, na vida humana, corresponderia a uma senhora já idosa. Quase todos os textos sobre IA têm início com a sua história de altos e baixos. Os baixos costumam ser chamados de invernos da IA. Foi só na última década ou pouco mais do que isso que a IA passou a mostrar a que veio. Suas aplicações têm se multiplicado e, se formos fundo, há IA em quase tudo que fazemos hoje. Ela está lá onipresente, mas sempre invisível, pois softwares e algoritmos não se assemelham a esculturas que se exibem ao nosso olhar. São linguagens, no grau máximo de abstração. Mas, nem por isso, agem, produzem resultados, estes sim, visíveis nos seus efeitos pragmáticos.

Não vamos começar de tão longe a visita ao robô dialogante (assim passei a chamá-lo, pois, na realidade é isso que ele é). Basta pegar o nosso bonde no enorme sucesso da aprendizagem profunda (deep learning) aquela que, por meio de funções matemáticas, imita até certo ponto o funcionamento das redes neuronais do nosso cérebro. Isso levou a uma variedade de aplicações. Entre elas, os carros autônomos, o reconhecimento de imagem, o problemático reconhecimento facial e também aquilo que aqui nos interessa prioritariamente: o processamento de linguagem natural (NLP, na sigla em inglês), potente para a interação humano-computador (afinal somos não apenas seres falantes, mas adoramos conversar), para aplicações em chatbots (por exemplo, aqueles chatíssimos atendentes quando telefonamos para uma empresa em busca de informações), para tradução de idiomas (com que o Google tradutor nos premia) e para resumo de textos (que, via de regra, os alunos levam algum tempo para aprender a fazer).

Seguindo nessa trilha, o próximo ponto de parada é o Transformer (que não tem nada a ver com algum monstro produzido em Hollywood por meio de efeitos especiais). Ele pertence ao que é chamado de modelo amplo de linguagem (Large Language Model) ou seja, são algoritmos que aprendem a realizar associações estatísticas entre bilhões de palavras e frases para executar tarefas como gerar resumos, traduzir, responder perguntas e classificar textos. O Transformer, por sua vez, é uma técnica matemática de economia de tempo, inventada em 2017, no sentido de permitir que o treinamento algorítmico ocorra em paralelo em muitos processadores. No ano seguinte, “o Google lançou um grande modelo baseado em Transformer chamado BERT, que levou a uma explosão de outros modelos usando a técnica. Frequentemente, eles são pré-treinados em uma tarefa genérica, como previsão de palavras, e depois ajustados para tarefas específicas: eles podem receber perguntas triviais, por exemplo, e treinados para fornecer respostas” (Hutson, 2021, https://www.nature.com/articles/d41586-021-00530-0).

Desde então nasceu uma família de Transformadores: GTP1, 2 e o mais recente 3, de que o Chat é um rebento. GPT é a sigla para Transformador Pré-treinado Generativo. O 3 é mais de 100 vezes maior que seu antecessor de 2019, GPT-2. “O simples treinamento de um modelo tão grande, que exigia uma coreografia complexa entre centenas de processadores paralelos, foi “uma impressionante façanha de engenharia”, nas palavras de Colin Raffel (apud Hutson, ibid.).

A explicação de como isso se tornou possível depende da potência da rede neural que é medida por quantos parâmetros ela possui. Os números definem a força das conexões entre os neurônios. Mais neurônios e mais conexões significam mais parâmetros. O GPT-3 tem 175 bilhões. O próximo maior modelo de linguagem desse tipo tem 17 bilhões (mais força bruta do que isso parece impossível, mas ela cresce!). “Em janeiro (2021), o Google lançou um modelo com 1,6 trilhão de parâmetros, mas é um modelo ‘esparso’, ou seja, cada parâmetro trabalha menos. Em termos de desempenho, isso equivale a um modelo ‘denso’ que tem entre 10 bilhões e 100 bilhões de parâmetros”, nas palavras de William Fedus (apud ibid.).

O ChatGPT é um ajustamento da versão avançada do GTP-3, que também era capaz de produzir textos, mas textos duros, sem a maleabilidade da linguagem natural. Ademais a otimização do Chat, como o próprio nome diz, voltou-se para o diálogo com os usuários, ou seja, desenvolver a capacidade de responder perguntas. Ele cria texto ao vasculhar bilhões de palavras de dados de treinamento e aprender como as palavras e frases se relacionam entre si (Stolke-Walker, 2022, https://www.nature.com/articles/d41586-023-00107-z#Echobox=1674273921).

A IA generativa

O ChatGPT pertence à família da IA generativa que se estrutura em duas molduras: Generative Adversarial Network (GAN) e Generative Pre-trained Transformer (GPT). A GAN usa duas redes neurais que competem entre si para realizar previsões mais precisas, colocando uma contra a outra (portanto, “adversarial”) de modo a gerar novas instâncias de dados sintéticos que podem passar por dados reais. As GANs usam uma estrutura cooperativa de jogo de soma zero para aprender. Elas são amplamente utilizados na geração de imagem, vídeo e voz. O GPT é um modelo de linguagem autorregressivo baseado na arquitetura do transformador, pré-treinado de maneira generativa e não supervisionada, que mostra desempenho decente em configurações multitarefa de zero/um/poucos disparos (Luhui Lu, 2022, https://pub.towardsai.net/generative-ai-and-future-c3b1695876f2).

Muita discussão foi recentemente despertada pelos lançamentos de IAs generativas para a produção de imagens, um tipo de produção inédita pois, graças aos algoritmos, a imagem é produzida a partir de comandos verbais, um caso extraordinário de tradução intersemiótica. Programas computacionais de tradução de som em imagem e vice-versa já são aquisições que se solidificaram na produção criativa. Mas a tradução do verbal ao visual precisava do Transformador. Entre outros lançamentos desse tipo, o DALL•E 2, por exemplo, é proveniente da mesma empresa do ChatGPT, a Open AI. O DALL E 2 emprega principalmente duas técnicas: CLIP (Contrastive Language-Image Pre-training) e modelos de difusão. O CLIP é essencial para conectar a descrição do texto aos elementos da imagem. Os modelos de difusão são modelos generativos baseados em transformadores. O Dall E 2 usa uma versão do GPT-3 modificada para gerar imagens. Ele pode combinar conceitos, atributos e estilos para gerar imagens realistas ou fantásticas em altas resoluções.

Tanto essa IA generativa de imagens quanto outras de tipo similar vêm despertando discussões no campo da arte, do design e da arquitetura, mas nada que possa ser comparado ao estado febril que o ChatGPT vem provocando em tão pouco espaço de tempo. Por que será? A hipótese é que, enquanto a geração de imagens afeta o nicho dos produtores criativos no campo da visualidade, o ChatGPt afeta todos os seres humanos falantes e letrados, levando nisso todas as profissões e formações educacionais em todas as áreas em que a linguagem verbal em maior ou menor medida está envolvida. Onde ela não está? Eis a questão. Portanto, a interferência do ChatGPT no cerne do humano é gigantesca e aguda.

O ChatGPt falando de si mesmo

Mal havia eu começado a escrever este texto, já fui espionada pelos algoritmos e, poucas horas depois, recebi no meu e-mail, sem que, de modo algum, tenha pedido, vindo da News Letter do Linkedin (sem que eu houvesse aberto esse aplicativo), uma postagem de Carla Oliveira, na qual ela apresenta um texto escrito pelo ChatGPT, que, a partir das perguntas por ela formuladas, forneceu respostas claras e objetivamente secas sobre si mesmo: o que ele é, por que foi criado, de onde vem sua criação (a empresa Open IA, fundada em Elon Musk e outros, em 2015), suas aplicações (produção textual, agente de conversação, geração de conteúdo, postagens em plataformas de redes sociais, e-comércio, respostas automáticas de e-mail, modelagem de linguagem e outras, pois o modelo pode ser ajustado para tarefas específicas), suas ameaças (criar dependência do modelo, plágio, vieses, acriticidade) e, inclusive, o que pensa de si mesmo (em linguagem isenta dos típicos constrangimentos, volteios e modalizações, que afetam o ser humano quando fala de si!). Sem dúvida, impressionante é a primeira impressão de todos aqueles que o estão experimentando. Sim, o texto é correto, claro, frases e parágrafos são perfeitamente ajustados. Contudo, o conteúdo semântico é achatado se compararmos às explicações que são dadas por especialistas sobre o tema.

Propositalmente escrevi o presente texto com características e recursos que o robô dialogante, com sua redação de estudante muito bem comportado (alguns já o chamam de papagaio estocástico), não seria capaz de imitar. Ao contrário do meu, seus textos não apresentam pessoalidade marcada, metáforas que nem precisam ser muito poéticas (bastam as caseiras), ironia para bons entendedores, fontes de referência explicitadas, senso comum, contextualização situacional, etc. Em suma, se esse robô não melhorar seu desempenho adquirindo marcas pessoais que todo texto humano (mesmo quando o autor tenta disfarçá-las) deixa como rastro, não teremos que nos preocupar com plágios, pois as redações do ChatGPT, embora corretamente estruturadas, com coerência sintática e consistência semântica, são tão padronizadas que, para aqueles que têm alguma experiência em análise de texto, não será difícil reconhecer que o robô dialogante andou por lá.

Isso não significa, de modo algum, minimizar a intensidade das consequências científicas, culturais, políticas, jurídicas, éticas, educacionais e psíquicas, que a entrada da IA generativa no âmago do reino humano — o reino da linguagem — está trazendo e trará. Diante disso, não temos apenas que preparar os nossos corações, mas erguer as mangas do nosso entendimento e capacidade crítica e criativa pois o ChatGTP, que está apenas em sua fase experimental, embora tenha também um fundo lúdico, não veio para brincar.

3 respostas em “Para não perder o bonde do ChatGPT

  1. Pingback: ChatGPT & humanos: alguns linques e opiniões (1) – Insustentável Leveza 2

  2. Pingback: O que é ChatGPT, por que ele está ALUCINANDO e onde estão os HUMANOS? IA Descomplicada #3 » chatGPT 活用動画まとめ

  3. Pingback: O ChatGPT veio para colocar a ética humana à prova – Sociotramas

Deixe um comentário