O processamento de linguagem natural (PLN) é uma ramificação da inteligência artificial que faz com que os computadores possam entender textos e palavras faladas da mesma forma que humanos podem.
O PLN combina linguística computacional, modelagem baseada em regras da linguagem humana, com modelos estatísticos, de machine learning e de deep learning. Juntas, essas tecnologias permitem que os computadores processem a linguagem humana na forma de dados de texto ou de voz e 'entendam' seu significado integral, completo com a intenção e o sentimento do locutor ou do escritor.
O PLN tem origem em inglês: natural language processing (NLP). Ele aciona programas de computador que convertem texto de um idioma para outro, respondem a comandos de fala e resumem grandes volumes de texto rapidamente, até mesmo em tempo real.
Podemos encontrar exemplos de PLN no nosso dia a dia em dispositivos como GPS operados por voz, assistentes digitais, software de ditado de fala para texto, chatbots de atendimento ao cliente e outras conveniências do consumidor. Além disso, o PLN também desempenha um papel crescente em soluções corporativas que ajudam a aperfeiçoar operações de negócios, aumentar a produtividade do funcionário e simplificar processos de negócios de missão crítica.
A linguagem humana é repleta de ambiguidades que tornam incrivelmente difícil criar software que determine com precisão o significado pretendido de dados de texto ou de voz.
Homônimos, homófonos, sarcasmo, expressões idiomáticas, metáforas, gramática e exceções de uso, variações na estrutura de sentenças, apenas algumas das irregularidades da linguagem humana que humanos levam anos para aprender, mas que os programadores devem ensinar aplicativos orientados por linguagem natural a reconhecer e entender com precisão desde o início, se esses aplicativos forem para ser úteis.
Várias tarefas do PLN detalham os dados de texto e voz humanos de maneira que ajudam o computador a entender o que ele está ingerindo. Alguns desses exemplos incluem o seguinte:
Veja a postagem do blog "NLP vs. NLU vs. NLG: as diferenças entre três conceitos de processamento de linguagem natural" para uma visão mais profunda de como esses conceitos se relacionam.
A linguagem de programação Python fornece uma ampla variedade de ferramentas e bibliotecas para abordar tarefas de PLN específicas. Muitas delas podem ser encontradas no Kit de ferramentas de linguagem natural, ou NLTK, uma coleção de bibliotecas, programas e recursos de educação de software livre para desenvolver programas de PLN.
O NLTK inclui bibliotecas para muitas das tarefas de PLN listadas acima, além de bibliotecas para subtarefas, como análise sintática de sentenças, segmentação de palavras, stemming e lematização (métodos de cortar palavras até suas origens) e tokenização (para dividir frases, sentenças, parágrafos e passagens em tokens que ajudam o computador a entender melhor o texto). Inclui também bibliotecas para implementar recursos, como o raciocínio semântico, a capacidade de chegar a conclusões lógicas com base em fatos extraídos do texto.
Os primeiros aplicativos de PLN eram sistemas baseados em regras, codificados manualmente, que podiam executar parte das tarefas de PLN, mas não eram capazes de ajustar a escala facilmente para acomodar um fluxo aparentemente sem fim de exceções ou de lidar com os volumes crescentes de dados de texto e voz.
Introduza o PLN estatístico, que combina algoritmos de computador com modelos de machine learning e deep learning para extrair, classificar e rotular automaticamente elementos de dados de texto e voz e, em seguida, designar uma probabilidade estatística para cada significado possível desses elementos. Atualmente, modelos de deep learning e técnicas de aprendizado baseadas em redes neurais convolucionais (CNNs) e redes neurais recorrentes (RNNs) permitem sistemas de PLN que 'aprendem' à medida que trabalham e extraem significado cada vez mais preciso de enormes volumes de conjuntos de dados de texto e voz brutos, não estruturados e não rotulados.
Para uma visão mais detalhada sobre as nuances entre essas tecnologias e suas abordagens de aprendizado, consulte "IA vs. Machine Learning vs. Deep Learning vs. Redes neurais: qual é a diferença?"
O processamento de linguagem natural é a força motriz por trás da inteligência de máquina em muitos aplicativos modernos do mundo real. Veja alguns exemplos:
Encontre respostas e insights críticos a partir de seus dados de negócios usando tecnologia de procura corporativa impulsionada por IA.
O serviço de processamento de linguagem natural (PLN) para análise avançada de texto.
A plataforma líder de mercado em inteligência artificial conversacional onde você pode criar agentes de voz e chatbots.
Saiba mais sobre os diferentes casos de uso de PLN neste explicador de PNL.
Descubra como o processamento de linguagem natural pode ajudá-lo a conversar de forma mais natural com computadores
Use os serviços de processamento de linguagem natural do IBM Watson para desenvolver aplicativos cada vez mais inteligentes
Aprenda conceitos fundamentais de inteligência artificial e IA generativa, incluindo engenharia de prompts, modelos de linguagens amplos e os melhores projetos open source.
CRM é um software de gerenciamento de relacionamento com o cliente. Para resolver problemas, oferecer suporte a vendas e promover iniciativas de ERP.
Saiba mais sobre a internet das coisas e como as empresas estão utilizando os dados dos dispositivos para aumentar a eficiência operacional em todos os setores.