NASAのアーカイブでドキュメント理解の経験を積むDocugamiの新モデル

2017-08-24_00h03_35 IT総合
最近はデータについての話題が多いため、膨大な量の処理が世界中のドキュメントで行われていることを忘れてはいないだろうか。ドキュメントは多様なファイルや形式が混在する動物園のようなものだ。非常に大きな価値はあるが、クリーンな構造化データベースの時代にはまだ適合していない。Docugami(ドキュガミ)はこの状況を変えようとしている。Docugamiのシステムは、任意のドキュメントを直感的に理解した上で、内容に対してインテリジェントな方法でインデックスを作成する。NASAはこの計画に賛同している。
Docugamiのプロダクトが計画どおり機能すると、何年にもわたり積み上げられたドキュメントの山を、誰でも瞬時に使いやすいデータに変換できるようになる。
どんな会社でも、運営していればドキュメントが大量に発生する。契約書や法的書類、不動産の賃貸借契約書や同意書、マーケティング関連の提案書やリリースノート、医療のカルテなどがある。形式もさまざまで、Word(ワード)ドキュメント、PDF、ワードからエクスポートしたPDFを印刷してスキャンしたものなど、多岐にわたる。
この問題に対応しようと何年にもわたって努力が払われたが、すべてのドキュメントを1カ所に集め、社内で共有したり編集したりできるようにするなど、大部分は組織側の対応だった。ドキュメントを理解するということは、それを扱う人間に委ねられてきた

リンク元

コメント

タイトルとURLをコピーしました