「マルチメディア」カテゴリーアーカイブ

マルチメディア技術

情報処理技術者試験での学習内容

【応用情報・基本情報】
・コンピュータにおける文字,音声,画像などの仕組み,特徴,それらを統合して取り扱うマルチメディアの考え方,必要な資源,機能を修得し,応用する。
・情報の圧縮,伸張の目的,特徴,仕組みを修得し,応用する。
・マルチメディアシステムの特徴,マルチメディア応用の例を修得し,応用する。

【ITパスポート】
・音声や画像の符号化の種類と特徴を理解する。
・情報の圧縮と伸張の特徴を理解する。
・マルチメディア技術の応用目的や特徴を理解する。

(1)マルチメディア ITパスポート 基本情報 応用情報

情報のディジタル化,文字,音声,画像などの複数のメディアの統合,インタラクティブ性などマルチメディアの特徴を理解する。また,複数のメディアを編集,統合するオーサリングなど,マルチメディア処理の考え方,必要な資源,機能を理解する。

用語例:Web コンテンツ,ハイパメディア,ストリーミング,オーサリング環境,メディア統合,PDF,DTP

(2)音声処理 ITパスポート 基本情報 応用情報

音声データのディジタル化の原理,音声ファイルの仕組み,代表的な音声ファイル形式の特徴を理解する。

用語例:PCM(Pulse Code Modulation:パルス符号変調),MIDI,WAV(Waveform Audio Format),AU(Audio or mu-law),AIFF(Audio Interchange File Format),MP3,標本化周波数,量子化ビット数,MIDI 音源,サンプリング

(3)静止画処理 ITパスポート 基本情報 応用情報

光の3 原色(Red,Green,Blue)と色の3 原色(Cyan,Magenta,Yellow),画素(ピクセル),解像度,階調など,コンピュータにおける画像表現の仕組み,代表的な静止画ファイル形式の特徴を理解する。

用語例:JPEG,GIF,PNG,BMP,TIFF,Exif(Exchangeable Image File Format),ディザリング,ルックアップテーブル,レイヤ,トリミング

(4)動画処理 ITパスポート 基本情報 応用情報

フレーム,フレームレートなど,コンピュータにおける動画表現の仕組み,代表的な動画ファイル形式の特徴,動画編集の基本的な手法を理解する。

MPEG,QuickTime,AVI,Motion JPEG,インタレース方式,プログレッシブ方式,リニア編集,ノンリニア編集

(5)情報の圧縮・伸張 ITパスポート 基本情報 応用情報

メディアの種類に応じた圧縮・伸張方法が利用されること,圧縮・伸張の目的,代表的な方式の特徴,仕組み,用途に応じて適切な圧縮方式を選択し,活用することを理解する。

用語例:JPEG,MPEG,ZIP,LZH,圧縮率,可逆圧縮,非可逆圧縮,ランレングス,MH(Modified Huffman),MR(Modified READ),MMR(Modified Modified READ),MP3,効率の良いデータ保存,ネットワーク負荷軽減

(6)マルチメディア応用 ITパスポート 基本情報 応用情報

マルチメディアシステムの特徴,VR(Virtual Reality:バーチャルリアリティ),インターネット放送,ノンリニア画像編集システムなどのマルチメディア応用の例を理解する。

用語例:CG,CAD,シミュレータ,テレビゲーム,AR(Augmented Reality:拡張現実感),マルチメディアデータ合成処理,ビデオオンデマンド,DSP(Digital Signal Processor),ディジタル放送,3 次元映像,モーションキャプチャ,バーチャルサラウンド

マルチメディア

この記事での学習内容 ITパスポート 基本情報 応用情報

情報のディジタル化,文字,音声,画像などの複数のメディアの統合,インタラクティブ性などマルチメディアの特徴を理解する。また,複数のメディアを編集,統合するオーサリングなど,マルチメディア処理の考え方,必要な資源,機能を理解する。

用語例:Web コンテンツ,ハイパメディア,ストリーミング,オーサリング環境,メディア統合,PDF,DTP

マルチメディア

マルチメディアとは、文字情報に加えて、画像、音声などの様々な情報を二進値に変換してデジタル化し、コンピュータを使って統合的に扱うことです。

情報のデジタル化、文字、音声、画像などの複数のメディアの統合、インタラクティブ性などの特徴があります。インタラクティブ性とは対話性や双方向性のことです。マルチメディアを活用することで、使いやすく、わかりやすいユーザインタフェースが実現します。

ハイパメディア

ハイパメディアはリンク構造を持つ文書であるハイパテキストの拡張です。文字、音声、画像などの複数のメディアを関連付け(リンク)する技術・概念で、様々な利用、アクセスが可能になります。

Webページはハイパテキストの応用であり、Webコンテンツはこれを構成する要素・メディアのことです。

ストリーミング

ストリーミングは、インターネットの動画配信などに用いられている技術です。ストリーミングは、動画や音声などのファイルを再生と同時にダウンロードするという特徴があります。そのためダウンロードが完了するまで待つ必要がありません。一方で配信中にダウンロードが間に合わず、画面が停止するといった状況も起こります。

オーサリングソフト

オーサリングとは「著作」という意味の言葉です。オーサリングソフトは、文字やグラフィックス、音声などの素材を組み合わせて作品を執筆する(*)のに使用するソフトウェアです。

*この作業のことを「オーサリング」という。

代表的な製品に旧マクロメディア社のDirectorやFlash、Adobe社のDreamweaverなどがあります。

なお、オーサリングソフトといっても、音楽(DTM)系、出版(DTP)系、Web系など多くのジャンルのものがあります。

PDF(Portable Document Format)

PDFは電子出版向けの文書ファイル形式です。ソフトウェアパッケージごとに異なるファイル形式を使うという不便を解消するため、米アドビシステムズ社が提唱した印刷物頒布用のファイル形式です。

ワープロソフトなどで作成した文書をPDFファイルに変換すると、フォントの種類や大きさ、画像のレイアウト情報などが保存され、異なる環境でも常に同じ印刷結果が得られます。

PDFが必要とされる背景として、ソフトウェアパッケージは、各々独自のファイル形式を使うものが多いので、違う製品同士ではほとんどデータの互換性がありません。その為、同じワープロソフトでも、製品やバージョンが違うとデータを利用できない場合があり、そういった不便を解消するために、文書の回覧時にはPDFが積極的に用いられています。

音声処理

この記事での学習内容 ITパスポート 基本情報 応用情報

音声データのディジタル化の原理,音声ファイルの仕組み,代表的な音声ファイル形式の特徴を理解する。

用語例:PCM(Pulse Code Modulation:パルス符号変調),MIDI,WAV(Waveform Audio Format),AU(Audio or mu-law),AIFF(Audio Interchange File Format),MP3,標本化周波数,量子化ビット数,MIDI 音源,サンプリング

音声のデジタル化

アナログ信号である音声データをデジタル化する方法に、パルス符号化方式(PCM:Pulse Code Modulation)があります。

標本化・量子化・符号化の3段階の手順で行います。

1.標本化(サンプリング)
音声を一定周期(一定時間ごと)で測定して標本化する。
2.量子化
測定値をある程度の粗さの目盛りに当てはめて数値化する。
3.符号化(エンコーディング)
数値を2進数に置き換えて符号化する。

一例として、音楽CDの場合、下記の手順でデジタル化が行われています。

  1.  44kHzの周期でサンプリング
  2.  16ビットで量子化(216=65536段階で数値化)
  3.  量子化した値を2進数で符号化

標本化の間隔が短いほど、また量子化の段階数が多いほど、元のアナログ音声に近いものになります。

音声のファイル形式

主な音声データ形式には次のようなものがあります。

型式名特徴
MP3形式MPEG規格の一つで、音声の圧縮形式。
音声データをCD並の高音質のまま、従来の10分の1以下のサイズに圧縮できるため、
音声ファイルの転送に広く用いられる。
MIDI形式電子楽器とパソコンを接続して楽曲データを交換するための規格。
音色や音程などのデータをやり取りする手順が定められている。
WAVE/AIFF形式前者がwindowsの標準音声形式で、後者がMacOS向けのもの。
基本的に非圧縮で、1分で約10MB。音質は音楽CDとほぼ同等。
AAC形式
(Advanced Audio Coding)
Apple社のiPodなどでよく利用されている方式で、MPEG2、MPEG4のオーディオ圧縮技術を利用したもの。
技術的にはMP3にあたる。Apple社のiPodシリーズの他、携帯電話の着うたやWeb上での音楽配信などで利用されている。
WMA形式
(Windows Media Audio)
音楽CD並の音質を保ちながら、容量を22分の1まで圧縮可能な形式。
こちらも音楽配信などで利用されている。

 

静止画処理

この記事での学習内容 ITパスポート 基本情報 応用情報

光の3 原色(Red,Green,Blue)と色の3 原色(Cyan,Magenta,Yellow),画素(ピクセル),解像度,階調など,コンピュータにおける画像表現の仕組み,代表的な静止画ファイル形式の特徴を理解する。

用語例:JPEG,GIF,PNG,BMP,TIFF,Exif(Exchangeable Image File Format),ディザリング,ルックアップテーブル,レイヤ,トリミング

解像度

画像の精細さは画素の密度で決まります。画素の密度を解像度といい、dpi(dots per inch)という単位で表します。dpiは1インチの範囲に並ぶドットの数を表し、この値が大きいほど高密度で高い画質が得られます。

なお、プリンタの印字品質も同じdpiで表されます。この値が大きいほど、きめ細やかで高品質な印刷ができます。

色の3属性

画面表示や印刷の重要なポイントに「色」があります。色は「色相」「明度」「彩度」によって表現されます。

色相(色み)
「赤」「緑」「青」などそれぞれの色
明度(明るさ)
「明るい赤」~「暗い赤」など
最も明度の高いのは「白」で低いのは「黒」
彩度(鮮やかさ)
「鮮やかな赤」~「くすんだ赤」など

発光体であるディスプレイの場合には、色の表現に光の三原色であるRGB方式を使い、色を加えるほど明るくなる加法混色という方法を使います。

対して、印刷をするプリンタの場合は、印刷の三原色であるCYMK方式を使い、インクを重ね塗りするほど暗くする現方混色という方法を使います。

RGB方式

RGB方式は、光の三原色である赤(Red)、緑(Green)、青(Blue)を段階的に混色する方式です。3色の光を均等に最も強く出したときが「白」となり、3色全てを出さない時に「黒」となります。

RGBの指定方法

HTML文書などで表示色の指定をする場合、6桁の16進数を使って色を決めます。赤・緑・青の順でそれぞれの強さを2桁の「00」~「FF」という16進表示で表します。「00」が最も弱く、「FF」が最も強い指定で、画面にはこの3色が混ざった色が表示されます。「000000」が黒を意味し、「FFFFFF」が白を意味します。

CYMK方式

CYMK方式は、印刷の三原色であるシアン(Cyan:青)・マゼンタ(Magenta:赤)・イエロー(Yellow:黄)に黒を加えた4色のインクを使う方式です。

C/Y/Mのインクを均等に混ぜると、理論上は黒が出来るのですが、よりクリアな黒を発色するために、黒インクを別にしています。

なお、CYMKのKは「Key plate」のKで、KuroのKではありません。キープレートとは、印刷において、画像の輪郭など細部を示すために用いられた印刷板のことを指す用語で、これに通常黒が使われることから「K=黒」とされています。

グラフィックスソフトウェア

グラフィックスソフトウェアとは、図形やイラストを作成するソフトウェアです。ペイント系ソフトウェアとドロー系ソフトウェアに分けられます。

分類特徴代表的なソフトウェア
ペイント系ソフト画像をビットマップ(ラスタデータ)として扱う。
写真などの色調の変化や加工を行ったりするのに向いている。
Adobe Photoshop等のフォトレタッチソフト
ドロー系ソフト図形を輪郭のベクトル(ベクタデータ)として扱う。
実態に近いなめらかな曲線を描くのに向いており、新たにイラストを起こしたり、ロゴを作成したり、という用途に向いている。
Adobe Illustrator等のドローソフト、CADソフト

静止画のファイル形式

主な静止画像のデータ形式には、次のようなものがあります

名称特徴
JPEGJoint Photograph Experts Groupの略。スマートフォンやデジタルカメラで主流の画像ファイル形式。
24ビットフルカラー(約1,677万色)の静止画像が扱える静止画像の圧縮形式。
圧縮率が高く画像サイズを小さくでき、色数や階調表現の多いカラー写真画像などの保存に使われる。
一般に、元のデータを完全には復元できない非可逆圧縮方式が用いられる。
GIFカラー静止画像の圧縮形式。
色数が256色と少ないので、イラストなどの保存に適している。
元のデータを復元できる可逆圧縮形式のランレングス法を用いている。
BMPドットイメージとして静止画像を保存する形式。
圧縮はされていないので、保存時の容量が大きくなる。
PNG48ビットフルカラーの静止画像が扱える圧縮形式。透過属性を設定できる。
圧縮率が高く画像サイズを小さくでき、可逆圧縮形式のため画像が劣化しないが、JPEGほどの圧縮率はない。

動画処理

この記事での学習内容 ITパスポート 基本情報 応用情報

フレーム,フレームレートなど,コンピュータにおける動画表現の仕組み,代表的な動画ファイル形式の特徴,動画編集の基本的な手法を理解する。

MPEG,QuickTime,AVI,Motion JPEG,インタレース方式,プログレッシブ方式,リニア編集,ノンリニア編集

フレーム

動画像とは、映画やアニメのような動く画像のことです。コンピュータで動画像を扱うには、その仕組の理解が必要となります。

同画像を構成する画像がフレームです。フレームを連続して表示することで、人間の目には残像が残り、これにより動画に見えます。

フレームレート

同画像の品質を表す単位にフレームレートがあります。フレームレートとは、1秒あたりのフレームの数で、fps(フレーム/秒)で表します。

値が大きいほど動画像がなめらかになりますが、データ量が増えるので圧縮が必要になります。

動画ファイルの形式

テレビやビデオなどの動画の圧縮符号化方式にはMPEGが使われます。ISOにより設置された専門家組織の名称がそのまま使われました。(Moving Picture Experts Group)

以下の表のように細分化されています。

名称特徴
MPEG-1CD-ROMなどの再生に使われる符号化方式。
処理は単純でソフトウェアのみで行えるが、やや画質が劣る。
音声を含んだ圧縮になっている。
転送速度は1.5Mbps。
MPEG-2DVDやハイビジョンの映像などに使われる、MPEG-1よりも高品質な符号化方式。
ハードウェアでの処理が必要。
動画の圧縮とリアルタイム再生が可能。
転送速度は数M~数十Mbps。
MPEG-4携帯電話などの低速な移動体通信での利用を対象にした符号化方式。
転送速度が数k~数十kbps。

AVI(Audio Video Interleaving)形式

Microsoft社が開発した、Windows上で音声つきの動画を扱うためのフォーマットです。Windows上でマルチメディアデータを格納する際に用いられる RIFF というフォーマットを応用し、画像データと音声データを交互に織り交ぜた構造となっていることから、この名前がつけられています。

*RIFF:Resource Interchange File Format
Microsoft社によって策定された、画像や音声などの様々な形式のデータを一つのファイルに格納するための共通フォーマット。
WAVファイルやAVIファイルもRIFF形式のファイルの一つ。

Quick Time

Apple社の開発した、パソコンで動画や音声を扱うためのソフトウェアです。当初は同社のMac OS用でしたが、現在ではWindows環境でも広く使われています。

1998年2月には国際標準化機構(ISO)によって、動画フォーマットの国際基準MPEG-4のファイルフォーマットとして、QuickTimeが採用されました。

1998年5月に登場したQuickTime 3.0ではWindows標準の動画・音声フォーマットであるAVI形式やWAV形式の再生もサポートされたので、広く利用されるようになりました。

その後、インターネット対応を強化し、ストリーミング機能のサポートや、Java版クライアントの追加などが行われています。

 

情報の圧縮・伸張

この記事での学習内容 ITパスポート 基本情報 応用情報

メディアの種類に応じた圧縮・伸張方法が利用されること,圧縮・伸張の目的,代表的な方式の特徴,仕組み,用途に応じて適切な圧縮方式を選択し,活用することを理解する。

用語例:JPEG,MPEG,ZIP,LZH,圧縮率,可逆圧縮,非可逆圧縮,ランレングス,MH(Modified Huffman),MR(Modified READ),MMR(Modified Modified READ),MP3,効率の良いデータ保存,ネットワーク負荷軽減

圧縮と伸張

圧縮とはファイルサイズを小さくするための技術です。伸張とは圧縮したデータを元の状態に復元する技術、あるいはその処理そのもののことをいいます。

マルチメディアデータはファイルの容量が大きくなりがちなため、ファイル形式そのものに圧縮技術を使っているものが多く、これらはその形式で保存するだけで容量が小さくなります。

可逆圧縮と非可逆圧縮

圧縮方法には可逆圧縮と非可逆圧縮があります。可逆圧縮方式は、圧縮した情報を元に戻すと完全に元の情報と同じものになります。

一方、非可逆圧縮方式は、伸張した時に完全な形では元の情報に戻りません。そのかわり、高い圧縮率が可能になりますので、画像や音声に用いられています。

例えば、画像の非可逆圧縮方式であるJPEGでは、伸張した時に完全な形で元の画像には戻りませんが、この画質の劣化が人間の目では分からない程度になるように工夫されています。

圧縮ファイル

文書ファイルやワークシートなどの容量を小さくして保存するには、圧縮プログラムを使って圧縮ファイル形式に変換します。

多くの圧縮プログラムには、複数のファイルを一つの圧縮ファイルにまとめる書庫(アーカイブ)機能もあります。

圧縮ファイルはそのままでは使えないので、利用時に伸張する必要があります。

主な圧縮ファイル形式には、ZIP形式やLZH形式があります。

なお、マルチメディアデータとは異なり、圧縮ファイルの形式には可逆圧縮方式を使う必要があり、先述のZIP形式やLZH形式は可逆圧縮方式となっています。

マルチメディア応用

この記事での学習内容 ITパスポート 基本情報 応用情報

マルチメディアシステムの特徴,VR(Virtual Reality:バーチャルリアリティ),インターネット放送,ノンリニア画像編集システムなどのマルチメディア応用の例を理解する。

用語例:CG,CAD,シミュレータ,テレビゲーム,AR(Augmented Reality:拡張現実感),マルチメディアデータ合成処理,ビデオオンデマンド,DSP(Digital Signal Processor),ディジタル放送,3 次元映像,モーションキャプチャ,バーチャルサラウンド

マルチメディアシステムの特徴

マルチメディアは、シングルメディアや従来の報道と比べると、次の特徴があります。

  • 表現の種類が、文章だけでなく、図、画像、動画、音声などと多彩である。動画にはアニメーションや3次元物体像を多様な角度から眺めることを含む。また、触覚などの非言語インタフェースも含む。
  • 対話型操作が出来る。コンテンツの構成順序に従うだけでなく、ユーザが状況に応じて選択したり、手順を変えたりすることが出来る。
  • コンピュータのデジタル処理の特徴が加味される。
  • ネットワークの特徴が加味される。

VR(Virtual Reality)

VR(仮想現実感)とは、マルチメディア応用システムとして、模擬的に実現した現実的な感覚です。

コンピュータグラフィックスや音響効果を組み合わせて、人工的に現実感を作り出す手法です。人工的な現実感という意味では、例えば小説や映画などのメディア表現も含まれますが、VRでは以下の要素が条件とされます。

  • 人が移動可能な仮想空間(virtual world)
  • 人の五感の多くを併用して受け取る没入感(immersion)
  • 人の位置や動作を察知して反応する感覚フィードバック(sensory feedback)
  • 人が働きかけることのできる対話性(intetactivity)

インターネット放送

インターネット放送はマルチメディア応用の典型です。ラジオ番組やテレビ番組をインターネット経由で放送することです。

従来の放送と異なり、インターネットを検索して視聴したい番組を選ぶことができます。また、放送局でなくても、誰でも不特定多数の人へ番組を放送することができます。

ノンリニア編集システム

ノンリニア編集システムは、直接アクセス方式を活かして音声や映像を編集するコンピュータシステムです。

2台の再生用デッキから出力用デッキへ直線的(リニア)にコピーしながら、記録係の記録や時刻情報だけを手がかりに編集する編集機器と比べて、ショット(場面)の名称付与、修正、順序変更、削除、追加などが容易です。また、元の音声、映像の他に字幕追加、アフターレコーディング、アニメーション、コンピュータグラフィックス(CG)の追加などが容易です。

シミュレータ

シミュレータは『模擬体験実験システム』のことで、現実では実験・体験の難しい物を仮想空間上で行うものです。

マルチメディア応用システム、あるいは仮想現実間のシミュレータには以下のような多様なシミュレータがあります。

自動車シミュレータ、電車シミュレータ、船舶シミュレータ、航空機シミュレータ、発電所シミュレータ、医療シミュレータ、火災シミュレータ、地震シミュレータなどがあり、職員の教育や見学者の模擬体験などに使われます。

AR(Augmented Reality)

AR(拡張現実感)とは、現実に対してコンピュータが付加した感覚を合わせて得られる感覚です。例えば、透過型ディスプレイをメガネとして装着して、現実に見ている視界に対して、コンピュータの生成した情報を付加します。

提示される環境の主体が現実環境であることから、現実環境における作業支援がその応用分野として期待されています。

例えば、道案内情報の提供、航空機やコピー機のメンテナンスを行う技術者に対する技術情報提供、医療分野における手術支援に向けた情報提示などの応用研究が行われています。

VOD(Video On Demand)

ユーザが見たいと思った時に見られる、プル型のコンテンツ配信サービスです。時と場所を選ばずに利用することができます。

PCやスマートフォン、タブレットによる受信が可能ですが、セットトップボックスという機器を用いて、テレビ受像機で視聴するができるサービスもあります。

*プッシュとプル
データ配信サービスには、プッシュ型とプル型があります。
プッシュ型では、既存の放送のように、情報を提供する側に主導権があり、放送時間などが決まっています。
一方、プル型では、VODのように情報をリクエストする側に主導権があります。見たいものを見たい時間に自らリクエストすることができます。