ITパスポート 令和5年度 問14:system_strategyに関する問題
AIの活用領域の一つである自然言語処理が利用されている事例として,適切なものだけを全て挙げたものはどれか。a Webサイト上で,日本語の文章を入力すると即座に他言語に翻訳される。b 災害時にSNSに投稿された文字情報をリアルタイムで収集し,地名と災害情報などを解析して被災状況を把握する。c スマートスピーカーを利用して,音声によって家電の操作や音楽の再生を行う。d 駐車場の出入口に設置したカメラでナンバープレートを撮影して,文字認識処理をし,精算済みの車両がゲートに近付くと自動で開く。
- aa, b, c正答
- ba, b, d
- ca, c, d
- db, c, d
AI解説(初心者・標準・上級)
理解度に合わせて3レベルの解説を無料で読めます。
答えは a「a, b, c」 です。
「自然言語処理」とは、人間が使う“ことば(文章や話し言葉)”をコンピュータに理解・処理させる技術のこと。
- a 日本語を入れたら他の言語に翻訳→“ことば”を扱うので○
- b SNSの文字から地名や災害情報を読み取る→“ことば”を読み解くので○
- c 音声で家電を操作→話した“ことば”を理解するので○
- d ナンバープレートをカメラで読む→これは“文字や数字を画像から見分ける”画像認識。ことばの意味は扱わないので×
👉 覚え方:「ことば(話す・書く)=自然言語処理」「目で見て判断=画像認識」。
だから d だけ仲間外れで、答えは a。
なぜこれが正解か
正解は a(a, b, c)。自然言語処理(NLP)は人間の言語(テキスト・音声を文字化したもの)を解析・生成する技術。
- a 機械翻訳:文章の意味を解析して別言語へ変換=NLPの代表例。
- b SNS投稿の文字情報から地名・災害内容を抽出・解析=テキストマイニング/情報抽出でNLP。
- c スマートスピーカーの音声操作:音声認識でテキスト化し、その意味を解釈して動作=NLPを含む。
誤りの選択肢
- d ナンバープレートの文字認識(OCR)は画像から文字を識別する画像認識の領域。読み取った数字の“意味”を言語的に解析するわけではないのでNLPの事例とは言えない。
覚え方・ひっかけ注意
dの「文字認識」という語に惑わされない。OCR=画像認識、言語の理解・生成=NLP。「文字を画像から拾う」のと「ことばの意味を扱う」のは別物と区別する。
理論的背景
自然言語処理(NLP:Natural Language Processing)は、人間が日常的に使う言語(日本語・英語等の「自然言語」)をコンピュータが理解・生成・変換できるよう処理する人工知能の一分野だ。従来の手法ではルールベース(文法規則・辞書の手作業定義)が主流だったが、2017年にGoogleが発表した「Transformer」アーキテクチャとその応用であるBERT・GPTシリーズの登場により、大量のテキストデータを自己教師あり学習する大規模言語モデル(LLM)が現在の主流となっている。本問の4事例の分類では、a(機械翻訳)・b(SNS投稿のテキスト情報の解析・地名と災害情報の抽出=固有表現抽出)・c(音声でのスマートスピーカー操作=音声認識+意図理解)の3つがNLPを本質的な技術として活用しており、dのナンバープレート認識はカメラで文字を画像として認識するコンピュータビジョン(画像認識・OCR)の領域だ。
実務での使われ方
NLPの実用化は急速に進んでいる。機械翻訳(DeepL・Google翻訳)の精度向上により、専門文書の参考翻訳が実用レベルに達した。テキストマイニング(大量の顧客レビュー・SNS投稿からの感情分析・課題抽出)はマーケティング・製品開発に活用され、本問bの「SNS文字情報からの地名・災害情報抽出」はその応用例だ。コールセンターのFAQ自動応答・チャットボット・AIアシスタント(Siri・Copilot等)もNLPの産物で、音声認識(音→テキスト)とNLP(テキストの意味理解)と音声合成(テキスト→音)の三段構成で動作する(本問cに対応)。生成AI(ChatGPT・Gemini等のLLM)による文書作成・コード生成・要約も、大規模NLPの代表的な応用だ。
試験での位置づけ
ITパスポートのストラテジ・テクノロジ系でAI技術の事例識別は最重要テーマで、「どの事例が自然言語処理か」「どの事例が画像認識か」「機械学習の教師あり/なし学習か」という分類問題が繰り返し出題される。本問の核心は「dのナンバープレート文字認識がNLPではなく画像認識(OCR)」という判断で、「文字を認識する=NLP」という誤った直感に引っかからないことが正答の条件だ。近年は生成AI(LLM)・RAG(検索拡張生成)・マルチモーダルAI(テキスト+画像を扱うAI)の登場で出題語彙が拡大しており、AI各技術の役割と適用範囲の理解が問われるレベルが上がっている。
選択肢の発展補足
選択肢dの詳細(ナンバープレート文字認識):OCR(Optical Character Recognition:光学文字認識)は画像から文字を識別する技術で、コンピュータビジョン(CV)の一部として位置づけられる。プレートの文字を識別して「品川300 あ 1234」と読み取る処理は文字形状の画像パターンマッチングであり、その読み取った番号の「意味」(誰の車か・精算済みか)はデータベース照合で判定する——言語的な意味解析(NLP)ではない。一方、読み取った番号と顧客名・住所を照合して「この車のオーナーの今月の来店状況を確認する」といった処理にNLPが介在する余地はあるが、本問の設問文はゲート開閉という照合制御の話に限定されている。選択肢間の対比(AIの分類として):AIの活用領域は大きく「画像認識(コンピュータビジョン)」「音声認識」「自然言語処理(テキスト)」「数値予測(機械学習全般)」に整理できる。cのスマートスピーカーは音声認識+NLPの複合で、aとbはテキスト処理=NLP、dは画像認識=CVという分類だ。「音声→テキスト化→NLP」という音声AIのパイプラインを理解しておくと、スマートスピーカー系の問題で迷わなくなる。
出典:IPA(情報処理推進機構)公式 ITパスポート試験 令和5年度 問14/ 公的機関配布資料につき出典明記の上引用。解説は合格ナビによる独自AI解説です。