ITの基礎知識｜ITパスポート・基本情報

基本情報技術者令和6年公開問題科目A 問15

2026.06.17

ビッグデータ分析の前段階として，非構造化データを構造化データに加工する処理を記述している事例はどれか。

ア　関係データベースに蓄積された大量の財務データから必要な条件に合致するデータを抽出し，利用者が扱いやすい表計算ソフトウェアデータに加工する。
イ　個人情報を含むビッグデータを更に利活用するために，特定の個人を識別することができないように匿名化加工する。
ウ　住所データ項目の中にある，”ヶ”と”が”の混在や，丁番地の表記不統一を，標準化された表記へ統一するために加工する。
エ　ソーシャルメディアの口コミを機械学習によって単語ごとに分解し，要約を作り，分析可能なデータに加工し，関係データベースに保管する。

基本情報過去問 , 令和6年公開問題 , ビッグデータ , 構造化データ・非構造化データ , 業務分析・データ利活用 , 企業と法務 , 企業活動

前の記事へ次の記事へ

正解：　エ

解説：

まず用語を整理します。

構造化データ：行と列で整理され，関係データベース等でそのまま扱える形式のデータ（売上テーブル，顧客マスタなど）
非構造化データ：決まった構造をもたないデータ（SNSの投稿文，メール本文，画像，音声，動画など）

本問が問うているのは「非構造化 → 構造化」への変換事例です。

ア：関係データベースのデータは元から構造化データです。構造化→構造化（抽出・加工）であり，該当しません。
イ：匿名化加工は個人情報保護のための処理であり，データの構造を変える話ではありません。
ウ：表記ゆれの統一はデータクレンジング（名寄せ・標準化）です。住所データはすでに項目として格納されている構造化データであり，該当しません。
エ：SNSの口コミ（自由記述の文章＝非構造化データ）を機械学習で単語分解・要約し，関係データベースに保管できる形式（＝構造化データ）に加工する。正解。

ビッグデータ分析では，こうした前処理（テキストマイニングの形態素解析など）によって非構造化データを分析可能な形に変換する工程が重要になります。