A OpenAI define o ChatGPT como um chatbot, termo da língua inglesa formado pela junção de chat (conversa) e bot, abreviação de robot (robô). A palavra robô tem origem no termo tcheco robota, que significa trabalho forçado ou servidão, em referência às obrigações impostas aos camponeses durante o sistema feudal (Robô, s.d.). Assim, chatbot, em sentido literal e provocativo, significa “servo da conversa”, um sistema computacional obrigado a sempre oferecer uma resposta aos questionamentos de usuárias/os. Na Computação, traduzimos chatbot para “agente conversacional”, enfatizando a sua capacidade de agir e de interagir com seres humanos por meio de uma língua natural.
Entretanto, não foi como um robô de conversação que compreendemos a IA generativa inicialmente. Não tínhamos a impressão de estar em uma conversa, pois ela não puxa assunto, não “joga conversa fora”, não quer saber sobre nossas vidas pessoais e responde com textos elaborados, frequentemente extensos. Essas características destoam do padrão típico descrito no clássico modelo de análise conversacional (Sacks; Schegloff; Jefferson, [1974] 2003). Por exemplo, em uma interação humana, os turnos e conteúdos não são predeterminados; já na interação com a IA generativa, existe um padrão rígido de pares conversacionais: uma pergunta humana (prompt) seguida por uma resposta gerada pela IA.
Embora não nos sintamos conversando com a IA, algumas/uns amigas/os nossas/os discutem com ela e até usam marcadores de polidez: “Por favor, você poderia resumir o artigo em anexo para mim?”. Nós, autores deste livro, optamos por interagir com comandos objetivos: “Resuma o artigo em anexo”.
Para muitas/os linguistas, a conversação é uma atividade exclusivamente humana, o que levanta questionamentos importantes: seria possível ampliar esse conceito para incluir interações com a IA generativa? Podemos considerar as trocas textuais com a máquina como uma forma de conversa? O renomado linguista Noam Chomsky, por exemplo, rejeita essa caracterização:
O ChatGPT é, assim, um exercício inteligente de simulação. Percorre quantidades astronômicas de dados, por meio de programas inteligentes, para produzir resultados semelhantes à informação que encontra. Não diz nada sobre linguagem, aprendizagem, inteligência (Chomsky, 2023, n.p.)
Negar a capacidade de conversação da IA generativa é um apego à tradição? Esse debate ainda precisa ser enfrentado. Por ora, optamos por reconhecer a subjetividade: se algumas pessoas se sentem conversando com a IA generativa, aceitaremos, ao menos provisoriamente, que ela também é um robô de conversação, mesmo que nós, autores, não tenhamos essa percepção.
Se não percebíamos a IA como uma interlocutora, então o que ela era para nós? Em nosso contato inicial com o ChatGPT, pensamos que a IA generativa era uma fonte de informações, uma nova forma de acessar os conteúdos da web. Contudo, no começo, o ChatGPT-3.5 não podia buscar informações online, estava limitado às informações utilizadas em seu treinamento, finalizado em setembro de 2021, o que o diferenciava dos mecanismos tradicionais de busca. Essa distinção foi atenuada quando, três meses após seu lançamento, a Microsoft integrou o GPT ao Bing (Endicott, 2023), caracterizando-o como um “copiloto para navegar na web”, denominado Copilot. Posteriormente, a própria OpenAI implementou o acesso à internet no ChatGPT (Figueiredo, 2023). Embora o modelo de linguagem, em si, não acesse a internet durante a geração da resposta, algumas aplicações podem integrar funcionalidades que buscam informações online, seja para fornecer dados atualizados ao contexto do prompt, seja para checar as informações geradas pelo modelo, entre outras finalidades. O processo de geração é baseado exclusivamente nos parâmetros internos do modelo, calculados durante o pré-treinamento com grandes volumes de dados. Portanto, a IA generativa não atua como um mecanismo de busca; seu objetivo é gerar conteúdos novos.
Outra caracterização comum é a de assistente virtual, similar à Alexa, capaz de realizar tarefas em resposta a comandos escritos ou por voz. Embora compartilhe algumas funções com esses assistentes, a IA generativa oferece respostas muito mais elaboradas e executa tarefas mais complexas, como gerar códigos de programação ou criar todo um website.
Seria, então, a IA generativa uma espécie de “oráculo contemporâneo”? Diferentemente dos antigos oráculos, que respondiam enigmaticamente, ela oferece respostas objetivas. Seu conhecimento é sobre-humano, pois deriva do processamento de volumes extraordinários de textos, muito superiores ao que uma pessoa poderia ler em toda a vida. Um adulto lê, em média, 250 palavras por minuto (Brysbaert, 2019); o ChatGPT-3 processou cerca de 195 bilhões de palavras (Nottombrown, 2020), o que uma pessoa levaria aproximadamente 1.486 anos lendo ininterruptamente, 24h por dia. A capacidade de gerar respostas coerentes é sobre-humana, mas não infalível. Suas respostas estão sujeitas a erros; uma limitação inerente aos modelos de linguagem. Apesar de sua utilidade, a IA generativa deve ser utilizada com discernimento e senso crítico; não se pode confiar nela cegamente.
Se, por um lado, inicialmente hesitamos em reconhecer a IA generativa como uma interlocutora, por outro, aceitamos prontamente sua caracterização como tecnologia “generativa”, capaz de produzir textos inéditos. Isso nos levou à compreensão da IA como uma (co)autora em potencial. Essa caracterização é controversa, mas o fato é que, desde o lançamento do ChatGPT, tornou-se desafiador determinar se um texto foi escrito por um/a estudante ou pela IA, dado que os textos gerados computacionalmente são cada vez mais coerentes e indistinguíveis dos produzidos por seres humanos.
É complexo definir com precisão o que a IA generativa realmente é. Sua natureza ontológica envolve aspectos contraintuitivos e controversos: é inteligente sem ter consciência e emoções; é criativa, embora crie a partir de padrões aprendidos; utiliza a linguagem sem compreender a semântica das palavras; baseia-se em padrões de coocorrência entre palavras, sem acesso ao significado real dos termos; é conversacional, ainda que não siga todos os padrões típicos das conversas humanas; é coautora, embora desprovida de subjetividade e “espírito humano”.
Concluímos que a caracterização da IA generativa depende da relação que estabelecemos com ela, dos usos que dela fazemos. Para nós, autores deste livro, trata-se de uma entidade conversacional e coautora, embora ambas as caracterizações sejam questionáveis. Essas duas concepções ontológicas da IA generativa levaram-nos à identificação da emergência da autoria híbrida (Pimentel; Azevedo; Carvalho, 2023c) e do/a leitor/a generativo/a (Carvalho; Pimentel, 2023), noções que também emergem quando analisamos as novas práticas de leitura e de escrita com IA.
Novas tecnologias e mídias digitais possibilitam práticas inéditas de leitura e escrita, estabelecendo processos inovadores de produção, consumo e circulação de textos e imagens, alguns dos quais já se consolidaram como práticas culturais, conforme esquematizamos na figura a seguir. Compreender essas práticas é importante para o contexto educacional, pois a leitura e a escrita constituem a base dos processos formativos.
Fonte: dos autores
Nas últimas décadas, a computação deixou de ser domínio exclusivo de especialistas para tornar-se parte integrante do cotidiano de todas as pessoas, disseminando-se por todo o tecido social. Os computadores pessoais, popularizados na década de 1980, impulsionaram a prática da escrita editável[1] e da leitura multimídia[2]. Na década de 1990, com o desenvolvimento da web e a abertura da internet ao uso comercial, a sociedade passou a experimentar amplamente a leitura e a escrita de hipertextos[3]. Nos anos 2000, com a popularização dos celulares e dos smartphones, nos acostumamos à leitura e à escrita de micromensagens[4] e de mensagens instantâneas[5]. Já na década de 2010, o uso massivo dos sistemas de redes sociais promoveu novas formas de escrita colaborativa online e de leitura fragmentada, marcada por rápidas trocas de contexto à medida que deslizamos o dedo pela tela em rolagem infinita. Mais recentemente, na década de 2020, com a proliferação das tecnologias baseadas em IA generativa, novas práticas de letramento se consolidaram: a escrita comandada pela/o usuária/o por meio de prompts e a leitura de textos gerados durante a conversa com agentes baseados em IA generativa.
Fonte: dos autores
O esquema a seguir relaciona as noções de leitor generativo e de autoria híbrida às práticas de leitura e escrita com IA e às concepções ontológicas da IA generativa.
Fonte: dos autores
Essas concepções e noções nos conduziram a reflexões sobre as implicações da IA generativa para (re)pensar os processos educacionais, o que resultou no quadro teórico representado na figura a seguir.
Fonte: dos autores, com ilustrações de Mônica Lopes
Nesta última parte do livro, apresentaremos e discutiremos essas concepções e noções, assim como suas implicações pedagógicas e éticas. Nosso objetivo é compreender as potencialidades e os riscos do uso pedagógico da IA generativa, a fim de nos prepararmos melhor para as transformações em curso no contexto educacional.
[2] A noção de multimídia emergiu ao longo do século XX, à medida que diferentes tecnologias de comunicação passaram a ser combinadas. Embora experiências iniciais possam ser identificadas no cinema sonoro e nas apresentações audiovisuais, foi nas décadas de 1970 e 1980 que o termo começou a se consolidar, especialmente com o avanço das interfaces gráficas e dos computadores pessoais. A disseminação dos CD-ROMs e da internet na década de 1990 ampliou o uso da multimídia em contextos educacionais, culturais e comerciais, consolidando-a como uma forma interativa de expressão e aprendizagem.
[3] A concepção de hipertexto é atribuída a Vannevar Bush (1945), que propôs o Memex, uma máquina teórica composta por textos interligados que possibilitariam a/o usuária/o navegar por trilhas de informações de forma não linear. Já o termo hipertexto foi cunhado por Ted Nelson (1965), que já antecipava suas implicações para a educação: “Deixe-me sugerir que tal objeto e sistema, se devidamente projetado e administrado, poderia ter grande potencial para a educação, ampliando as possibilidades de escolhas do estudante, seu senso de liberdade, sua motivação e sua compreensão intelectual.” (Nelson, 1965, p. 96, tradução nossa)
[4] A micromensagem foi inspirada no serviço SMS (Short Message Service), comum em celulares desde os anos 1990, com limite de 160 caracteres por mensagem (Calvão; Pimentel; Fuks, 2014). A micromensagem ganhou notoriedade a partir de 2006 com o lançamento do Twitter, sistema que institucionalizou os textos curtos como forma dominante de expressão nas redes sociais digitais.
[5] A mensagem instantânea, foi inicialmente implementada em 1964 em um sistema operacional multiusuário de mainframe. Com o tempo, essa funcionalidade foi sendo desenvolvida e difundida, ganhando popularidade nos anos 1990 com sistemas como ICQ e MSN Messenger. A partir da década de 2000, com a expansão do acesso à internet e a popularização dos smartphones, a mensagem instantânea se consolidou por meio de aplicativos como Facebook Messenger, WhatsApp e Telegram (Calvão; Pimentel; Fuks, 2014).