ITの基礎知識|ITパスポート・基本情報

データの標準

2022.06.03

この記事での学習内容  応用情報 基本情報 

電子データ交換を行う際の文字コードやバーコードの代表的な標準を理解する。

文字コードなどの各種コード

→【文字の表現】参照

JAN コード

→【標準化の必要性・意義・身近な事例】参照

QR コー ド

→【標準化の必要性・意義・身近な事例】参照

ITF コード

ITFコード( Interleaved Two of Five )はバーコード体系の一つで、主に物流分野で使用されています。

商品を識別するためのJANコードとは異なり、梱包内容の識別に利用されており、受発注や納品時のほか、入出荷、仕分け、棚卸管理などにおいて活用されています。

ISBN コード

ISBNコード( 国際標準図書番号:International Standard Book Number )は、図書・資料の識別用に設定された国際規格です。

日本国内では、「JIS X 0305」として規格化されています。

現行の規格では、13桁のコードで表され、【接頭記号(978 or 979で固定)】【グループ記号(国・地域を識別)】【出版社記号】【書名記号】【チェックデジット】で構成されています。

なお、2006年までは、接頭記号のない10桁のISBNコードで運用されていました。

画像ファイルに関する規格

EPS

EPS(Encapsulated PostScript)形式は画像のファイル形式の一種で、他のメディアに埋め込むために必要な情報を補った画像フォーマットです。

Adobe Illustrator , Inkscape などのドロー系ソフトや、Adobe Photoshop , Paint Shop Pro などのビットマップ系ソフトで作成・編集することが可能です。

JPEG

JPEG(Joint Photographic Experts Group)形式は、静止画像を圧縮するための方式の一つです。

「ISO/IEC 10918-1:1994」「JIS X 4301:1995」としても規格化されています。

フルカラーの画像を高い圧縮率で圧縮できることから、デジタルカメラやスマートフォンでの写真のファイル形式としてよく用いられています。

また、古くからWebブラウザが標準でサポートしている画像フォーマットであったことも、普及の背景となっています。

ただし、非可逆圧縮方式のため、圧縮して保存を繰り返すと、画質の劣化が起きる弱点があります。

GIF

GIF(Graphics Interchange Format)形式は、256色以下の画像を扱うことができる、可逆圧縮形式の画像フォーマットです。

GIFフォーマットは開発の経緯から、アメリカのCompuServe社が著作権を有していたものの、内部では「LZW」というアメリカのユニシス社が特許を取得したアルゴリズムを利用していました。

古くからWebブラウザが標準でサポートしている画像フォーマットであり、「透過GIF」や「GIFアニメーション」という機能があったり、色数の関係でファイルサイズも小さいことから、Webページ上のイラスト類でよく用いられていました。

しかし、GIFの普及が進んだのちに、ユニシス社が「GIFにおけるLZWの利用」について特許料を徴収する方針に転換したことで、利用頻度が減少することとなりました。なお2022年現在、アメリカ・日本においては「LZW」の特許は既に失効しています。

ただ、特許は失効したものの、インターネットを取り巻く環境の変化(ブロードバンド化の進行)や、PNG形式という後継の画像フォーマットの普及もあって、以前ほどは利用されていない画像フォーマットです。

BMP

BMP(Windows Bitmap)形式は、Windowsにおいて標準でサポートされている画像フォーマットです。

ピクセル(画素)ごとに色や濃度の情報が記録されるタイプの画像フォーマットで、そのピクセルがX軸・Y軸の2次元で集まって構成されています。

また、BMP形式のようにピクセルの集合体で構成されるタイプの画像を「ビットマップ画像」あるいは「ラスタ画像」と呼びます。

TIFF

TIFF(Tagged Image File Format)形式は、ビットマップ画像の符号化形式の一種で、タグと呼ばれる識別子を使うことによって、様々な形式のビットマップ画像を柔軟に表現できるのが特徴です。

様々な圧縮方法がサポートされており、可逆圧縮方式が利用できるため、保存を繰り返しても画質の劣化を防ぐことが出来ます。

Exif

Exif(Exchangeable image file format)は、主にデジタルカメラでの保存に使用される画像フォーマットです。

ただ、画像フォーマットとはいっても、「写真用のメタデータを含む画像ファイルフォーマット」ということなので、画像そのものの規格というわけではなく、カメラの機種情報や撮影時の情報などの負荷的な情報(メタデータ)を画像に埋め込むための規格となっています。

対応している画像形式は、JPEG、TIFF、PNGとなっており、パソコンやデジタルカメラ上ではあくまでも JPEG・TIFF・PNG形式の画像ファイルとして認識されます。

動画ファイル

MPEG

MPEG(Moving Picture Experts Group)とは、動画・オーディオの標準化を行う、ISO/IECのワーキンググループの名称で、そこが策定した動画・オーディオの標準規格の名称が「MPEG」となっています。

2022年現在では、「MPEG-4」(ISO/IEC 14496)が広く利用されています。

音声ファイル

MP3

MP3(MPEG-1 Audio Layer-3)は、音響データを圧縮する技術の1つで、それから作られる音声ファイルフォーマットです。

名前が表すように、もともとはMPEGのオーディオ規格として開発されたものとなっています。

WMA

WMA(Windows Media Audio)形式は、Microsoftが開発した音声ファイルフォーマットです。Windowsパソコン以外でも対応している機器は多数ありますが、あくまでもMicrosoftの独自規格であるため、汎用性ではMP3に劣ります。

RealAudio

RealAudioは、アメリカのリアルネットワークス社が開発した音声ファイルフォーマットです。

2000年代初頭まではインターネットラジオなどのインターネット上のストリーミングオーディオの形式として一般的でしたが、次第にMP3などに取って代わられています。

AIFF

AIFF(Audio Interchange File Format)形式は、Apple社が開発した音声ファイルフォーマットです。

文書ファイル

SGML

→【その他の言語】参照

XML

→【その他の言語】参照

HTML

→【その他の言語】参照

TeX

TeXとは、ドナルド・クヌース(数学者・計算機科学者:スタンフォード大学名誉教授)が開発し、広く有志による拡張などが続けられている組版処理システムです。

マークアップ言語の形をとっており、文章そのものと文章の構造を指定する命令(コントロールシーケンス)が記述されたテキストファイルを読み込み、そこに書かれた命令により文章を組版し、組版結果を DVI 形式のファイルに書き出す、という仕組みになっています。

このDVIファイルに「紙面のどの位置にどの文字を配置するか」といった情報が書き込まれており、それを用いることで、単純なテキストでは表現できないような複雑な数式を紙面・画面に表現することが出来ます。

データフォーマット

CSV

CSV(comma-separated values)形式は、テキストデータをいくつかのフィールド(項目)に分け、区切り文字であるカンマ「,」で区切ったデータ形式です。

アプリ間・システム間でのデータ交換用のデファクトスタンダードとして、古くから多くの表計算ソフトやデータベースソフトで利用されています。

なお、類似のファイル形式として、タブ文字で区切られた「TSV(tab-separated values)」や、半角スペースで区切られた「SSV(space-separated values)」といったものもあり、これらを総称して「CSV(character-separated values)」と呼ぶ場合もあります。

フランス・ドイツ・イタリアなどのヨーロッパ諸国では、小数点記号にカンマを使う文化があり、区切り文字には「;(セミコロン)」を使う慣習があります。

そういった文化の違いも考慮して、CSV=character-separated values として扱っているソフトもあるわけです。

*例えば、Microsoft Excel ではテキストファイルからデータを取得する際の区切り文字としてカンマ以外にも「タブ」「セミコロン」「スペース」がサポートされています。

SYLK

SYLK(Symbolic Link)形式は、Microsoftが表計算ソフトやデータベースソフトでデータを変換・交換するために開発したファイル形式です。

ファイルの中身自体は、セミコロンで区切られたテキストファイルですが、CSVとは異なり、表内のセル位置を表す情報や、数値のフォーマットに関する情報なども含まれるのが特徴です。

Microsoft Officeが開発される以前から存在していた形式で、1986年以降更新が行われておらず、セキュリティ上の問題も指摘されています。