ヒューマンインタフェース

この記事での学習内容 ITパスポート 基本情報 応用情報

ヒューマンインタフェースを決定する要件,インタフェースを実現する技術の種類,特徴を理解する。

用語例:ユーザビリティ,アクセシビリティ,インタラクティブシステム,音声認識,画像認識,動画認識,特徴抽出,学習機能,選択的知覚,ユーザ操作の分析,身体的適合性,ノンバーバルインタフェース,マルチモーダルインタフェース,空間型インタフェース,自然言語インタフェース

ヒューマンインタフェース

ヒューマンインタフェースとは、コンピュータと人間が遣り取りをする部分のことです。具体的には、人間がコンピュータへ指示を入力するキー操作の機能や、コンピュータから人間へ処理結果を返す画面表示や印刷などの機能を指します。ユーザインタフェースともいいます。

画面の表示形式や入力の方法、帳票のレイアウトなどのヒューマンインタフェースは、システムを使うユーザによっての使い方を大きく左右する部分です。

ヒューマンインタフェースの要件は次のように分類されます。

身体的適合性
人の身体と機器とが適合していること。手の大きさとマウスの大きさの適合などです。
頭脳的適合性
人の頭脳の情報処理と機器が適合していること。情報的適合性ともいいます。(例:上から下、左から右と言った情報の流れ)
時間的適合性
人の作業時間、休息時間、機械の応答待ち時間などが適合していること。人の疲労も関係します。
環境的適合性
照明、気温、騒音など、人の好む環境と適合していること。
運用的適合性
人が対話型システムを運用すること、および運用管理をすることに適合していること。

ヒューマンインタフェースを実現する技術には次のようなものがあります。

音声認識
人の話す音声言語を解析し、文字データとして取り出す。
画像認識
人の画像を解析して、それが何かを識別する。
動画解析
人の動画を解析して、それが何かを識別する。
非言語インタフェース
人の五感(視覚、聴覚、味覚、嗅覚、触覚)のうち、言語以外の触覚などを機器との入力又は出力に使う。
自然言語インタフェース
機器特有のコマンドなどではなく、人が日常的に使っている言語をインタフェースにする。
特徴抽出
前述の各種の処理において、解析や識別に必要な特徴をまず抽出する。

入力機能の設計

入力機能の設計では、「ユーザにとって分かりやすく、入力しやすい」ことが最も大切です。

図書館の図書検索システムのような、コンピュータに不慣れな人が使うことが多いシステムの場合は、キーボードを使った文字入力をできるだけなくし、メニューから選ぶ形式や、タッチパネルを使用した入力にするなどの配慮が必要です。

一方、キーボードに慣れたユーザ向けの入力画面である場合は、キーボードとマウスの操作が混在すると操作性が落ちるので、マウスの仕様を減らし、番号を入力して選ぶメニュー形式にするなど、効率よく入力できる機能設計が望まれます。

インタラクティブシステム

インタラクティブシステム(対話型システム)は、ユーザとコンピュータ等の機械とが、対話しながら作業を進めていくシステムのことです。人の出力が機器の入力になり、機器の出力が人の入力になるという関係です。

人もシステムの構成要素として考えると、機器の性能や機能はシステムの属性の一部に過ぎず、人の機能や性能も含めて、能率的な作業ができることが大切です。

機器側だけをシステムとして考えると、人間中心設計という方針が必要です。また、対話型システムの開発には、ユーザ操作の分析が必要です。

ユーザ操作の分析
  • 要件分析段階には、ユーザの従来の作業を分析したり、対話型システムにおける人の作業の部分や条件を分析したりします。
  • 試験段階には、開発された機器を用いてユーザに作業してもらい、それを分析して使いやすさを改善します。ユーザビリティテストがその例です。
ユーザビリティ

ユーザビリティは、対話型システムの特性の一つであり、次の特性のまとまりです。

  • 効果: ユーザの作業の結果が効果的である。
  • 効率: ユーザが作業を進める過程が効率的である。
  • 満足度: ユーザがイライラしたりせずに、気持ちよく作業が出来る。
アクセシビリティ

対話型システムの特性の一つであり、多様な性質を持つ人々の誰でもが、利用しやすいという性質です。特に、障がい者や高齢者でも利用しやすいことが代表的です。例えば、老眼の人のために文字サイズを大きくすることが挙げられます。

人に特有な性質の一つに、選択的知覚があります。人は自分の興味や経験をベースにして、好みの物事を選択的に知覚し、好みでない物事は知覚しにくいという傾向があります。選択的知覚を利用するインタフェースや弱点を補強するインタフェースが望まれます。

音声認識

音声認識は、人の話す音声言語を解析し、文字データとして取り出すことです。メニューを選択すること無しに、人が音声で機器に指示を出すことが、倉庫の扉の開閉やカーナビゲーションなどに用いられます。音声による個人認証は、セキュリティのためのインタフェース技術ともいえます。

画像認識

画像認識は、人の画像を解析して、それが何かを識別することです。例えば、人の視線を解析してカーソルを移動したり、人の笑顔を解析してカメラのシャッターを押す代わりにしたりすることができます。顔認証、指紋認証、虹彩認証などは、セキュリティのためのインタフェース技術ともいえます。

動画認識

動画認識は、人の動画を解析して、それが何かを識別することです。人のジェスチャーによって、機器へ処理を指示することなのです。

特徴抽出

特徴抽出とは、音声認識、画像認識、動画認識、非言語インタフェース、自然言語インタフェースなどの解析処理や識別処理の前半に、解析や識別に必要な特徴をまず抽出することです。画像認識であれば、人の顔の輪郭を抽出するようなエッジ検出などがその例です。

ノンバーバルインタフェース(非言語インタフェース)

非言語インタフェース(ノンバーバルインタフェース)とは、人の五感(視覚、聴覚、味覚、嗅覚、触覚)のうち、言語以外の触覚などを機器との入力または出力に使うことです。

例えば、医療教育用の端末は、人の手からの力をコンピュータへ入力したり、人体の反発を模擬した力をコンピュータから出力したりします。

自然言語インタフェース

自然言語インタフェースとは、機器特有のコマンドなどではなく、人が日常的に使っている言語をインタフェースにすることです。

例えば、音声認識において、「開け」等の操作用語に限定することなく、「ドアを開けてください」などの自由な文を許容したり、識別をすすめるためにコンピュータから日常語で質問したりするのが、自然言語インタフェースの例です。