人工知能(AI)開発の機械学習を効率よく行うために、活用するべきアノテーションツール。近年では様々なアノテーションツールが登場しており、無料で使用できるものも増加してきています。
本記事では、人工知能(AI)開発におすすめの20ものアノテーションツールをご紹介し、さらにアノテーションツールの選び方のポイントまで徹底解説致します。
アノテーションとは
人工知能(AI)の機械学習において、必須の概念であるアノテーション。機械学習においてあらゆる形態のデータにタグを付け、意味づけを行うことです。膨大なデータに対し、アノテーションを実施することで、教師データ(正解)を付与し、機械学習のモデルにおいて正しいものを判断することが可能となります。
アノテーションの種類
アノテーションには、様々な種類があります。本項目では代表的なアノテーションについてご紹介致します。
セマンティックアノテーション
セマンティックアノテーションは、意味的アノテーションのことで、テキスト内における任意の単語に意味付けを行うタグ付けのことです。機械学習アルゴリズムがデータを読み込むことが可能となるようにする目的のアノテーションとなります。実例としては、検索エンジンにおける関連性の改良及びチャットbotの学習等が挙げられます。
画像・映像アノテーション
画像・映像アノテーションは、人工知能(AI)において画像認識及び映像処理の精度を高くするためのアノテーションのことです。画像認識及び映像処理を正しく学習させるために、正確にタグ付けされた膨大なデータ量が必要となります。実例としては、機密情報の漏洩防止のためのセキュリティシステム及び商品リストの分類、自動運転機能搭載車等が挙げられます。
テキスト及びコンテンツの分類
テキスト及びコンテンツの分類は、あらかじめ定義されたカテゴリをフリーテキストで記載された文書に割当お行うアノテーションのことです。具体例としては、ある特定の文書における分及び段落をトピック毎にタグ付けすることが可能です。実例としては、あらゆるジャンルにおけるニュース記事を主題別のカテゴリで分類すること等が挙げられます。
インテント抽出
インテント抽出は、語句及び文といったレベルにおいて、ユーザーの意図をタグ付けするアノテーションのことです。そのため、特定の要求を実行する際、必要になる表現のライブラリが構築されていき、チャットbot等でより高度かつ的確なコミュニケーションを取ることが可能となります。
アノテーションツールとは
アノテーションツールとは、元々用意されている様々なデータ(画像や音声、文章等)に対し、それぞれの説明等の付加情報の設定を行うためのツールのことです。特に人工知能(AI)における機械学習に用いる教師データ(正解)を設定する際に使用されます。人工知能(AI)技術及びディープラーニングの領域の進歩が進むにつれ、アノテーションツールの種類も増加してきているというのが現状です。
アノテーションツールの選び方のポイント
様々なアノテーションツールが存在しているため、どのアノテーションツールを選択するべきか悩んでしまうことも少なくありません。本項目では、アノテーションツールの選び方のポイントについて解説致します。
アノテーション要件に対応しているか否か
アノテーションツールを選ぶ上で最も大切であると言えるのは、開発したい人工知能(AI)に応じた種類のアノテーションであるかどうか、アノテーション要件を満たしているかどうかを明確にすることです。
使いやすさ
アノテーションでは、膨大な量のデータ処理を行わなければならないため、アノテーションツールの操作性についてきちんと把握することが大切です。その中で、動作の軽さはもちろん、直感的な操作が可能なものや、トラブルシューティングが充実しているもの等を選択しましょう。
AIモデル形式への出力形式の確認
アノテーションツールによっては、使用するフレームワークによって使用するAIモデル形式も異なってきます。そのため、アノテーションツールでも同じ出力形式が取れるものを選択する必要があります。
おすすめのアノテーションツール20選
アノテーションツールについての概要を理解したところで、おすすめのアノテーションツール20選をご紹介致します。
Lionbridge AI
Lionbridge AIは、20年にも及び人工知能(AI)プロジェクトの実績を持ち、Lionbridge AIが開発したAIプラットフォームは、画像及び音声、テキストのアノテーション機能が揃っています。100万人ものコントリビューターがアノテーション作業をサポートしてくれる上、感情分析及び合成音声の検証についても対応することが可能です。さらに300言語に対応しているため、多言語の人工知能(AI)に向けた機械学習データを迅速に提供してくれます。
Lionbridge AI | https://ai-scholar.tech/services/lionbridge-ai |
Incubit Annotation Platform
株式会社Incubitは、特に人工知能(AI)におけるディープラーニングを用いた画像認識技術を強みとしています。Incubit Annotation Platformは、複数人で実施するアノテーションプロジェクトを高品質かつ迅速なスピードで実現可能なアノテーションツールとなっており、画像を確認しつつ正確な指示をリアルタイムで共有することが可能です。
Incubit Annotation Platform | https://www.incubit.co.jp |
COCO Annotator
COCO Annotatorは、ブラウザ上で利用可能なオープンソースのアノテーションツールです、主に医療現場で使用されるDICOMの処理及びトラッキング、3Dの矩形等様々な処理ができます。さらにデータセットを読み込むことで、オートアノテーションすることも可能となり、便利なツールです。
COCO Annotator | https://github.com/jsbroks/coco-annotator?ref=madewithvuejs.com |
Flow
Flowは、人工知能(AI)データ処理サービス及びスマートアノテーションプラットフォーム、さらには多元的なラベリングツールを兼ね備えており、あらゆるAIアプリケーションに対応しています。あのテーターのコンピテンシー認証をはじめ、プロジェクト敵合成マッチング及び品質管理スタッフによる検査等のシステムが充実しており、ラベリングの品質が保証されています。
また、世界トップ3のセキュリティソフト会社であるTrend Microによってセキュリティが保護されており、データの即時消去及びデータの書き込み、アクセス制御等によってデータの安全性が保障されているのも嬉しいポイントです。
Flow | https://ai-flow.jp |
CVAT(Computer Vision Annotation Tool)
CVAT(Computer Vision Annotation Tool)は、ブラウザ上で利用することが可能なオープンソースのアノテーションツールです。前述したCOCO Annotatorと同様、医療現場で使用されるDICOMの処理及びトラッキング、3Dの矩形のアノテーション等、様々な処理を行うことができ、データセットを読み込むことでオートアノテーションも可能となっています。
CVAT(Computer Vision Annotation Tool) | https://github.com/openvinotoolkit/cvat |
VATIC(Video Annotation Tool from Irvine,California)
VATIC(Video Annotation Tool from Irvine,California)は、ブラウザを通して、動画アノテーションを行うことが可能なツールです。特徴としては、動画のフレームに対し、バウンディングボックスを設定した上で、物体名及びアクション等をラベル付けすることが可能であるということが挙げられます。さらに数フレームおきにアノテーションを行った際には、その間を自動的に補正してくれるという嬉しい機能も標準装備されています。
ただし、VATIC(Video Annotation Tool from Irvine,California)を使用する際には、コードをダウンロードし、自身のサーバー上で運用しなければなりません。
VATIC(Video Annotation Tool from Irvine,California) | http://www.cs.columbia.edu/~vondrick/vatic/ |
LEAR Image Annotation Tool
LEAR Image Annotation Toolは、プログラミング言語であるC ++とQtライブラリを利用し開発されたセマンティックセグメンテーション用のラベルを作成可能なオフラインのツールです。ピクセル単位でオブジェクトアノテーションを行うことができ、マスクファイル(.png形式)はオブジェクト毎に個別に生成されます。
LEAR Image Annotation Tool | https://lear.inrialpes.fr/people/klaeser/software_image_annotation |
Datatang AI
Datatang AIは、複数の特許を持つオートアノテーションツールを搭載したプラットフォームであり、あらゆる人工知能(AI)学習用データに対応可能となっています。世界中に2,000名を超える経験豊富なアノテーターが在籍しており、プロジェクトマネージャーがアノテーション作業に関わる全てのプロセスにおいて品質管理を行うため、作業品質及び納期の保証がされています。
Datatang AI | https://ai-scholar.tech/services/datatang-ai |
Microsoft VoTT(Visual Object Tagging Tool)
Microsoft VoTT(Visual Object Tagging Tool)は、画像及び動画のアノテーションを行うことが可能な無料ツールです。OSは問わず、クロスプラットフォームで使用することができる上、GUI操作のため専門知識がなくても容易にタグ付けができ、CNTKやTensorflow(Pascal VOC)、YOLOのアルゴリズムを使用する場合には、そのままの形式で出力することも可能です。
Microsoft VoTT(Visual Object Tagging Tool) | https://github.com/microsoft/VoTT |
LabelBox
LabelBoxは、年間500ラベルまでなら無料で使用可能な画像アノテーションツールです。LabelBox上のサーバーを利用して画像データをアップロードしたり、AWS(Amazon Web Services)上のデータに対して使用したりすることが可能となっています。CSVをはじめJSON、Pascal VOC、COCOといった様々な出力フォーマット形式に対応しています。
LabelBox | https://labelbox.com |
Annotorious
Annotoriousは、JavaScriptで構築されているオープンソースの画像アノテーションツールのことです。わずかなJavaScriptの記述で、Webサイト上の画像に対し描画及びコメント、さらにはラベリング機能を追加することが可能となります。
Annotorious | https://recogito.github.io/annotorious/ |
Image Annotation Programme
Image Annotation Programmeは、無料の動画アノテーションツールであり、主に物体認識モデルの教師データ(正解)作成をする際に有効となっています。MITライセンスによりコードが公開されており、出力方式はPascal VOCでバウンディングボックスを出力します。
Image Annotation Programme | https://allai.jp/image-annotation-programme/ |
LabelMe
LabelMeは、オープンソースの画像アノテーションツールです。特にセマンティックセグメーションに使用することができ、サーバー上にインストールしてしまえば、Webブラウザ上からアノテーションが行うことが可能となります。
LabelMe | http://labelme.csail.mit.edu/Release3.0/ |
Imglab
Imglabは、ブラウザから直接使用することが可能な画像アノテーションツールです。前提条件なく使用することが可能かつ必要なCPU及びメモリは最小限となっているため、非常に使いやすいツールと言えます。
Imglab | https://github.com/NaturalIntelligence/imglab |
VIA(VGG Image Annotator)
VIA(VGG Image Annotator)は、画像及び動画、音声におけるアノテーションツールです。ブラウザ上で動作するため、インストール及び設定等は必要ありません。HTML及びJavaScript、CSSのみをベースとしており、学術的なプロジェクトや商業的なアプリケーション開発のどちらでも利用可能となっています。
VIA(VGG Image Annotator) | https://www.robots.ox.ac.uk/~vgg/software/via/ |
labellmg
labellmgは、オープンソースの画像アノテーションツールで、物体検出のためのバウンディングボックス機能が搭載されています。アイコンがわかりやすいため直感的に操作することが可能となっています。出力形式はYOLOです。
labellmg | https://github.com/tzutalin/labelImg/ |
FastLabel
FastLabelは、日本語対応のWebブラウザ上から使用することができるアノテーションツールです。画像及び動画、テキスト及び音声等の幅広いアノテーションが可能であり、YOLOをはじめ、COCOやPascal VOC、VoTT、labelme等の出力形式にも対応しています。
FastLabel | https://fastlabel.ai/annotation |
Annostation
Annostationは、Webベースの画像認識AI専用アノテーションツールです。画像認識AIに必要とされる全てのアノテーションプロジェクトを1箇所で管理を行うことで、高品質のアノテーションデータを作成することが可能となっています。初めてアノテーションを行う人だとしても直感的に使用できるような使いやすさを実現しています。
Annostation | https://www.orni.co.jp/annostation |
harBest for Data
harBest for Dataは、画像及び動画、音声等のアノテーションツールです。全国に数多く存在するクラウドワーカーが一斉に作業を行うため、データ作成を高速かつ低コストで実現することが可能です。
harBest for Data | https://harbest.io |
ANNOFAB
ANNOFABは、誰でも簡単に使用することが可能なアノテーションツールです。高品質なデータを直感的に作成することができる上、進捗管理及び品質管理も同時進行で行うことが可能となっています。
ANNOFAB | https://annofab.com |
まとめ
人工知能(AI)開発におけるアノテーションツールについて、本記事では、人工知能(AI)開発におすすめの20ものアノテーションツールをご紹介し、さらにアノテーションツールの選び方のポイントまで徹底解説致しました。
開発する人工知能(AI)に合わせて、使い勝手の良い高性能なアノテーションツールを選択及び活用し、より精度の高い機械学習を行なって、高品質の人工知能(AI)を開発しましょう。