Poderá o ChatGPT destruir o império do motor de busca da Google?
Muito se tem falado nos últimos tempos sobre o ChatGPT e modelos de linguagem natural (large language models - LLM). Estes modelos aprendem a imitar linguagem humana com base numa coleção colossal de dados. O modelo estuda padrões e estruturas na linguagem, estabelecendo relações entre determinadas palavras ou sequência de palavras. Ao analisar o contexto e padrões do texto, o modelo é capaz de replicar escrita humana de uma forma precisa.
No caso do ChatGPT, chama-se ao seu processo de aprendizagem um método "sem supervisão". Uma técnica de aprendizagem com supervisão implica dar ao modelo as respostas certas, para que este possa aprender a replicar essas mesmas respostas. No caso polémico do sistema de previsão de reincidência criminal COMPAS, utilizado nos Estados Unidos, é necessário dar informação sobre criminosos passados ao modelo, bem como se estes voltaram a cometer crimes, para que este possa aprender a prever futuros criminosos.
No caso do ChatGPT não há respostas certas, apenas tentamos que este aprenda a imitar o que vê em textos escritos por humanos.
Após o modelo estar treinado, este passa a ser capaz de desempenhar uma série de funções linguísticas, incluindo a geração de conteúdo, tradução, responder a questões, entre outras. Os modelos são posteriormente afinados com a introdução de dados organizados e classificados, assim como com a introdução de mecanismos de feedback para desempenhar funções específicas e melhorar a performance do modelo.
Apesar do ChatGPT ter sido lançado apenas em novembro de 2022, o primeiro modelo de LLM (Word2vec) remonta já a 2013, tendo sido inicialmente desenvolvido por uma equipa de investigadores da Google. O ChatGPT estabeleceu, no entanto, um marco ao disponibilizar pela primeira vez ao público uma interface para usar LLM.
O sucesso foi imediato tendo chegado aos 100 milhões de utilizadores no espaço de apenas 2 meses. É a aplicação que conseguiu chegar a esse número no mais curto espaço de tempo.
A OpenAI é a empresa que está por trás do ChatGPT, tendo uma parceria comercial exclusiva com a Microsoft, que por sua vez detém 49% do capital da empresa.
No início de fevereiro, a Microsoft anunciou o lançamento da nova plataforma de motor de busca Bing com a integração da tecnologia de conversação baseada em LLM. A forma como o fez foi uma declaração de guerra à Alphabet (Google), empresa que controla o mercado global de motores de busca com uma quota superior a 90% (excluindo China). Nas palavras do CEO da Microsoft, Satya Nadella: "Espero que com a nossa inovação eles (Google) apareçam e mostrem que sabem dançar. Eu quero que o público saiba que fomos nós que os fizemos dançar".
No dia seguinte ao anúncio da Microsoft, a Alphabet publicou a sua resposta com o lançamento de um novo produto (Bard), genericamente com as mesmas funcionalidades que o novo Bing.
Os dois novos produtos (ambos em fase de teste) não são exclusivamente de pesquisa, mas também o podem fazer. É por isso relevante ponderar o que poderão significar estes produtos para o mercado dos motores de busca, nomeadamente para o incumbente, a Alphabet:
Em primeiro lugar, as receitas de search representaram, em 2022, 57% das receitas totais da empresa. O resto das receitas estão relacionadas com o YouTube, plataforma Android, operação de serviços de cloud e ainda vendas de hardware. Vale a pena referir também que uma série de pesquisas que hoje realizamos não parecem correr o risco de ser substituídas por um modelo de conversação como por exemplo:
- "Qual o website das Nações Unidas?"
- "Qual a temperatura para amanhã em Londres?"
- "Quais os restaurantes perto de mim?
A própria Alphabet explora esta questão ao referir que o modelo de conversação parece estar mais direcionado para responder a questões para as quais não existe uma única resposta. Algo para o qual o motor de busca tradicional pode também não ser muito eficiente.
Em segundo lugar, a fiabilidade e precisão de LLM é ainda muito reduzida, sendo comum a existência de respostas incorretas com a apresentação de dados totalmente fabricados. Antevê-se que este problema será melhorado nos próximos anos ou mesmo meses.
Por último, o modelo de monetização atual do negócio de search baseia-se na introdução de resultados pagos na lista de respostas apresentadas. Com a transição para um modelo conversacional não é claro que o modelo de monetização se mantém válido, havendo dúvidas quanto à possibilidade de introduzir um número semelhante de resultados pagos e se essa introdução virá a deteriorar a experiência de utilização.
Esta é uma questão para a qual tanto a Alphabet como a Microsoft irão procurar uma resposta nos próximos meses, tentando encontrar uma solução para proteger o valor dos seus negócios.
Como referido, esta tecnologia não se limita ao negócio de search. Várias empresas estão já a integrar soluções de conversação em produtos existentes ou na criação de novos produtos. A Microsoft, por exemplo, está a integrar estas soluções nos seus produtos do Microsoft Office para melhorar a produtividade dos utilizadores (exemplos: pedir ao assistente virtual que crie um email a resumir um determinado documento, criar uma transcrição e resumo automático de reuniões no Teams, etc.).
É inegável que a evolução tecnológica nesta área parece estar a acontecer a cada semana que passa. Em todos os momentos na história onde foram observados estes saltos tecnológicos, negócios multibilionários foram criados, uns morreram, outros adaptaram-se e prosperaram.
Enquanto investidores na Alphabet e na Microsoft, estamos especialmente interessados na evolução desta tecnologia e na forma como as equipas de gestão das duas empresas irão responder aos movimentos dos seus respetivos adversários. Os próximos meses prometem ser momentos entusiasmantes para acompanhar este jogo de xadrez entre duas das maiores empresas do mundo.