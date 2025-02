A ideia de "uma máquina que pensa" remonta à Grécia antiga. Mas desde o advento da computação eletrônica (e em relação a alguns dos tópicos discutidos neste artigo), eventos e marcos importantes na evolução da IA incluem o seguinte:

1950

Alan Turing publica Computing Machinery and Intelligence. Nesse artigo, Turing (famoso por ter decifrado o código alemão ENIGMA durante a Segunda Guerra Mundial e frequentemente ser chamado de "pai da ciência da computação") faz a seguinte pergunta: "As máquinas poidem pensar?"

A partir daí, ele oferece um teste, hoje conhecido como "Teste de Turing", em que um humano faria perguntas tentando distinguir entre respostas em texto de um computador e de um ser humano. Embora esse teste tenha sido submetido a muito escrutínio desde que foi publicado, ele continua sendo uma parte importante da história da IA e um conceito contínuo dentro da filosofia, pois usa ideias relacionadas à linguística.

1956

John McCarthy cunhou o termo "inteligência artificial" na primeira conferência de IA no Dartmouth College. (McCarthy inventou a linguagem Lisp.) Mais tarde naquele ano, Allen Newell, J.C. Shaw e Herbert Simon criaram o Logic Theorist, o primeiro programa de computador de IA em execução.

1967

Frank Rosenblatt constrói o Mark 1 Perceptron, o primeiro computador baseado em uma rede neural que “aprendia” por tentativa e erro. Apenas um ano depois, Marvin Minsky e Seymour Papert publicam um livro intitulado Perceptrons, que se torna um marco na pesquisa de redes neurais e, pelo menos por um tempo, um argumento contra iniciativas futuras de pesquisa em redes neurais.

1980

As redes neurais, que usam um algoritmo de retropropagação para treinar a si mesmas, tornaram-se amplamente utilizadas em aplicações de IA.

1995

Stuart Russell e Peter Norvig publicam Artificial Intelligence: A Modern Approach, que se torna um dos principais livros didáticos no estudo da IA. Na obra, aprofundam-se em quatro objetivos potenciais ou definições da IA, que distingue sistemas computacionais com base na racionalidade e pensamento versus ação.

1997

O Deep Blue, da IBM, vence o então campeão mundial de xadrez Garry Kasparov, em uma partida (e revanche) de xadrez.

2004

John McCarthy escreve um artigo, What Is Artificial Intelligence?, e propõe uma definição frequentemente citada de IA. Àquela altura, a era do big data e da computação em nuvem já estava em andamento, permitindo que as organizações gerenciassem propriedades de dados cada vez maiores, que um dia serão usadas para treinar modelos de IA.

2011

O IBM Watson vence os campeões Ken Jennings e Brad Rutter no Jeopardy! Além disso, naquela época, a ciência de dados começa a emergir como uma disciplina popular.

2015

O supercomputador Minwa da Baidu usa uma rede neural profunda especial, chamada de rede neural convolucional, para identificar e categorizar imagens com uma taxa de precisão maior do que a de um ser humano comum.

2016

O programa AlphaGo da DeepMind, alimentado por uma rede neural profunda, vence Lee Sodol, o campeão mundial de Go, em uma disputa de cinco jogos. A vitória é importante, dado o enorme número de movimentos possíveis no jogo (mais de 14,5 trilhões após apenas quatro jogadas). Mais tarde, o Google comprou a DeepMind por US$ 400 milhões.

2022

O aumento de grandes modelos de linguagem ou LLMs, como o ChatGPT da OpenAI, cria uma mudança enorme no desempenho da IA e seu potencial para gerar valor empresarial. Com essas novas práticas de IA generativa, os modelos de deep learning podem ser pré-treinados em grandes quantidades de dados.

2024

As mais recentes tendências da IA apontam para um renascimento contínuo da IA. Modelos multimodais que podem usar vários tipos de dados como entrada estão proporcionando experiências mais ricas e robustas. Esses modelos reúnem capacidades de reconhecimento de imagem por visão computacional e reconhecimento de fala por NLP. Modelos menores também estão avançando em uma era de retornos decrescentes com modelos maciços com grandes números de parâmetros.