ITの基礎知識|ITパスポート・基本情報

基本情報技術者 令和6年公開問題 科目A 問15

2026.06.17

ビッグデータ分析の前段階として,非構造化データを構造化データに加工する処理を記述している事例はどれか。

  • ア 関係データベースに蓄積された大量の財務データから必要な条件に合致するデータを抽出し,利用者が扱いやすい表計算ソフトウェアデータに加工する。
  • イ 個人情報を含むビッグデータを更に利活用するために,特定の個人を識別することができないように匿名化加工する。
  • ウ 住所データ項目の中にある,”ヶ”と”が”の混在や,丁番地の表記不統一を,標準化された表記へ統一するために加工する。
  • エ ソーシャルメディアの口コミを機械学習によって単語ごとに分解し,要約を作り,分析可能なデータに加工し,関係データベースに保管する。

 

Show answer

正解: エ

解説:

まず用語を整理します。

  • 構造化データ:行と列で整理され,関係データベース等でそのまま扱える形式のデータ(売上テーブル,顧客マスタなど)
  • 非構造化データ:決まった構造をもたないデータ(SNSの投稿文,メール本文,画像,音声,動画など)

本問が問うているのは「非構造化 → 構造化」への変換事例です。

  • ア:関係データベースのデータは元から構造化データです。構造化→構造化(抽出・加工)であり,該当しません。
  • イ:匿名化加工は個人情報保護のための処理であり,データの構造を変える話ではありません。
  • ウ:表記ゆれの統一はデータクレンジング(名寄せ・標準化)です。住所データはすでに項目として格納されている構造化データであり,該当しません。
  • エ:SNSの口コミ(自由記述の文章=非構造化データ)を機械学習で単語分解・要約し,関係データベースに保管できる形式(=構造化データ)に加工する。正解。

ビッグデータ分析では,こうした前処理(テキストマイニングの形態素解析など)によって非構造化データを分析可能な形に変換する工程が重要になります。