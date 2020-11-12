計算言語学から発展した自然言語処理は、コンピューター・サイエンス、人工知能、言語学、データサイエンスなど、さまざまな分野の方法を使用して、コンピューターが書き言葉と口頭の両方の形式で人間の言語を理解できるようにします。計算言語学は言語の側面に重点を置いていますが、自然言語処理では、言語翻訳や質疑応答などのタスクを完了するために機械学習とディープラーニング技術を使用することを重視しています。自然言語処理は、非構造化データを取得し、それを構造化データ形式に変換することで機能します。これは、固有表現の識別（Named Entity Recognitionと呼ばれるプロセス）と、単語の語根を調べるトークン化、ステミング、レマティゼーションなどの方法を使用した単語パターンの特定を通じて行われます。例えば、「called」などの単語の拡張子（-ed）は過去形であることを示しますが、基本は現在進行形の動詞と同じ不定詞（to call）です。

NLPアルゴリズムは多数存在しますが、言語タスクのタイプごとに異なるアプローチが使用される傾向があります。例えば、隠れマルコフ連鎖は、品詞のタグ付けによく使用される傾向があります。リカレント・ニューラル・ネットワークは、適切なテキスト・シーケンスを生成するのに役立ちます。N-gramsは、単純言語モデル（LM）であり、文やフレーズに確率を割り当てて、応答の精度を予測します。これらの技術は連携して、チャットボットなどの一般的なテクノロジーや、AmazonのAlexaやAppleのSiriなどの音声認識製品をサポートします。しかし、その用途はそれより広く、教育や医療などの他の業種・業務にも影響を与えています。