行政書士と生成AI⑮
- ezily5
- 2024年9月21日
- 読了時間: 1分
行政書士と生成AI⑮
AIで使用できる自然言語のデータベースがあることをご存じだろうか?
また抽象的な言葉を持ち出して申し訳けないが、前述の自然言語データベースをコーパスという。
コーパスとは簡単に言えば、AIのための非構造化されていない自然言語を読むための「辞書」である。
論文、判決文といった複雑で膨大なコーパスをAIが活用することができるようになった。
コーパスには、複数言語の処理、翻訳に使われる「対訳コーパス」、医療や金融といった業界ごとに特化したコーパスが構築されている。コーパが多いほど機械翻訳の精度は高まる。
一般に機械翻訳には20万ワードのコーパスが必要とされている。機械翻訳にコーパスは欠かせない。
Comentarios