構造化データと非構造化データの違い

データ資産の二元論

画像クリックでインフォグラフィックサイトに遷移します

エグゼクティブサマリー:データという資産の二つの側面

本レポートは、現代のビジネス環境において不可欠な資産である「データ」を、その根源的な二つの形態、すなわち「構造化データ」と「非構造化データ」の観点から徹底的に分析し、両者の異同、技術的背景、戦略的価値、そして未来展望を包括的に解説することを目的とする。

分析の中核をなすのは、構造化データが主に「既知の問い」に効率的に答えるための基盤であるという事実である。これは、売上実績の追跡や顧客情報の管理といった、明確に定義されたビジネスプロセスを支える。一方で、非構造化データは、その混沌とした性質の中に、これまで誰も問いかけることすらなかった「未知の洞察」を発見するための広大なフロンティアを内包している。顧客の隠れた感情、市場の予期せぬトレンド、新たなビジネスチャンスの萌芽は、この非構造化データの海に眠っている。

特筆すべきは、現代において生成・蓄積される全データ量の実に80%から90%が非構造化データによって占められているという現実である 1。この事実は、非構造化データの活用能力が、特に人工知能(AI)がビジネスのあらゆる側面に浸透しつつある現代において、企業の競争優位性を決定づける核心的要素であることを示唆している。この膨大なデータ資産を無視することは、もはや戦略的な選択肢ではなく、市場からの退場を意味しかねないリスクである。

したがって、本レポートが導き出す最終的な戦略的提言は明確である。未来志向のデータ戦略とは、構造化データと非構造化データを二者択一の対象として捉えるのではなく、それぞれの特性を深く理解した上で、ビジネスの目的に応じて両者を統合し、相乗効果を生み出すハイブリッドなアプローチを構築することに他ならない。本レポートは、そのための羅針盤となるべく、詳細な分析と具体的な指針を提供する。

第1章:データタイプの定義と本質

データ活用の戦略を論じる上で、その議論の起点となるのは、データの基本的な分類とその本質的な特性を正確に理解することである。データは一般的に、その構造の明確さに基づき、「構造化データ」「非構造化データ」、そしてその中間に位置する「半構造化データ」の三つに大別される。これらの分類は単なる技術的な形式の違いに留まらず、「データをどのように捉え、そこからいかにして価値を引き出すか」という、根底にある思想や世界観の違いを反映している。

1.1 構造化データ:秩序と厳格性の世界

定義

構造化データとは、ExcelやCSVファイル、リレーショナルデータベースに代表されるように、「行(レコード)」と「列(フィールド)」の概念を持つ、厳格に定義された表形式のデータである 5。その最大の特徴は、データを格納する前に、どのような項目(属性)を、どのような形式(データ型)で保持するかを定めた「データモデル」または「スキーマ」が事前に定義されている点にある 6。このアプローチは「スキーマオンライト(Schema-on-Write)」と呼ばれ、データを書き込む(保存する)時点で構造に準拠させることが強制されるため、データの一貫性と品質が高度に保証される 7。

具体例

構造化データは、主に企業の基幹業務や定型的なビジネスプロセスから生成される。

  • 顧客管理(CRM)システム: 顧客ID、氏名、住所、電話番号、購入履歴などが整然と格納されたデータベース 6
  • 販売時点情報管理(POS)システム: 店舗での取引ごとに記録される、日時、商品コード、数量、金額などのトランザクションデータ 6
  • 在庫管理システム: 製品コード、在庫数、倉庫の場所、入出庫日時などの情報 6
  • その他: Webサイトの問い合わせフォームから送信されるデータ、Excelで管理される財務諸表、人事システムにおける従業員情報など、多岐にわたる 5

本質的特徴

構造化データの本質は、その「秩序」と「予測可能性」にある。データはあらかじめ定められた構造に従うため、人間とコンピュータの双方にとってアクセス、解釈、そして処理が極めて容易である 6。その多くは数値や固定的な文字列で構成される定量的データであり、合計、平均、比較といった数学的な分析や集計処理に非常に適している 6。この特性により、構造化データはビジネスの現状を正確に把握し、過去の実績に基づいて将来を予測するための、信頼性の高い基盤となる。このデータタイプを支える思想は「管理と統制」であり、既知のビジネス要件を効率的かつ確実に満たすことを最優先とする。

1.2 非構造化データ:多様性と潜在能力の海

定義

非構造化データとは、構造化データとは対照的に、事前定義されたデータモデルや特定のスキーマを持たないデータ群を指す 1。これらのデータは、生成されたままの「ネイティブ形式」で保存され、特定の行や列の構造に当てはめることができない 2。データの意味や構造は、保存時ではなく、分析や利用の段階で初めて解釈・付与される。このアプローチは「スキーマオンリード(Schema-on-Read)」と呼ばれ、多種多様なデータをまずありのままに収集・蓄積することを可能にする 4。

具体例

現代のデジタル社会で生成されるデータの大部分は非構造化データであり、その種類は爆発的に増加している。

  • テキストデータ: Eメールの本文、ソーシャルメディアへの投稿、顧客からのレビュー、チャットのログ、WordやPDFなどの文書ファイル、コールセンターの通話記録など 1
  • メディアデータ: デジタルカメラで撮影された画像(JPEG, PNG)、監視カメラの映像、YouTubeなどの動画ファイル、会議の録音やポッドキャストなどの音声ファイル 1
  • センサーデータ: 工場の機械やスマートデバイスに搭載されたIoTセンサーから送られてくるログデータ(温度、湿度、振動など)、Webサーバーのアクセスログなど 4

本質的特徴

非構造化データの本質は、その「多様性」と「潜在性」にある。定性的な情報(質的データ)を豊富に含んでおり、そのままの状態では従来のデータベース技術による検索や集計、分析が極めて困難である 6。しかし、その形式の自由度と内包する情報の豊かさこそが、最大の価値の源泉となる。例えば、顧客レビューのテキストからは、製品に対する満足度や不満の具体的な理由、つまり顧客の「感情」や「意図」を読み取ることができる。これは、購入履歴という構造化データだけでは決して得られない深い洞察(インサイト)である 14。非構造化データを支える思想は「収集と発見」であり、現時点では価値が明確でない情報も含めて幅広く収集し、後から新たな技術や視点を用いて未知の価値を発見することを目指す。

1.3 半構造化データ:両者をつなぐ架け橋

定義

半構造化データは、構造化データのような厳格な表形式のスキーマを持たない一方で、非構造化データのように完全に無秩序でもない、両者の中間的な性質を持つデータである 19。具体的には、データ自体にその構造を記述するためのメタデータ(タグ、キーと値のペア、階層構造など)が含まれている 8。この自己記述的な性質により、ある程度の規則性を持ちながらも、構造化データほどの厳格さはない。分類上は、非構造化データの一種として扱われることが多い 17。

具体例

半構造化データは、特にWeb技術やアプリケーション間のデータ連携において中心的な役割を果たしている。

  • JSON (JavaScript Object Notation): { “name”: “John Doe”, “age”: 30 } のように、キーと値のペアで構成される軽量なデータ交換フォーマット。Web APIで広く利用されている 19
  • XML (eXtensible Markup Language): <person><name>Jane Doe</name><age>28</age></person> のように、タグを用いてデータの意味や階層構造を表現するマークアップ言語。設定ファイルや文書構造の定義に用いられる 19
  • その他: YAMLや、Webページを記述するHTMLファイルも、タグによって構造が定義されているため半構造化データの一例と見なせる 19

戦略的位置づけ

半構造化データの戦略的な価値は、構造化データの「秩序」と非構造化データの「柔軟性」という、相反する特性を両立させている点にある。構造化データよりも柔軟にフィールドを追加・変更できるため、進化の速いアプリケーションのデータ要件に追随しやすい 21。同時に、タグやキーといった構造を持つため、完全に非構造化なテキストデータよりも検索や特定の情報の抽出が格段に容易である 13。このように、半構造化データは、厳格な管理が求められる基幹システムと、柔軟な分析が求められる情報活用システムの間の「架け橋」として機能し、現代のデータエコシステムにおいて不可欠な存在となっている。

第2章:構造化データと非構造化データの徹底比較

構造化データと非構造化データは、単に形式が異なるだけでなく、その設計思想、管理手法、活用方法に至るまで、あらゆる側面で対照的な特徴を持つ。ビジネスリーダーがデータ戦略に関する的確な意思決定を下すためには、これらの違いがもたらすトレードオフを深く理解することが不可欠である。本章では、両者の差異を多角的に分析し、その戦略的意味合いを明らかにする。まず、全体像を把握するために、半構造化データを含めた三者の包括的な比較表を以下に示す。

表1:構造化・半構造化・非構造化データの包括的比較

比較項目構造化データ半構造化データ非構造化データ
定義事前に定義された厳格なデータモデル(スキーマ)に従う表形式データ 5スキーマは固定されないが、タグやキーで自己記述的な構造を持つデータ 19事前定義されたデータモデルや構造を一切持たないデータ 1
スキーマスキーマオンライト(書き込み時に定義)7スキーマは柔軟またはスキーマレス 21スキーマオンリード(読み込み時に解釈)4
データモデル事前定義済みで固定的 6データ内に構造が埋め込まれ、柔軟 21未定義 2
代表形式SQLデータベース、Excel、CSVファイル 5JSON、XML、YAML、HTML 19テキスト文書、画像、動画、音声、センサーログ 4
柔軟性低い。スキーマの変更が困難 6中程度。フィールドの追加・変更が容易 21非常に高い。ネイティブ形式でそのまま保存可能 7
拡張性主に垂直スケーリング(サーバー性能向上)が中心水平スケーリング(サーバー台数増加)に適している 21水平スケーリングに非常に適している 9
主なストレージリレーショナルデータベース(RDBMS)、データウェアハウス 2NoSQLデータベース(ドキュメントDBなど)、データレイク 17データレイク、オブジェクトストレージ、ファイルシステム 2
分析手法SQLによるクエリ、BIツールによる集計・可視化 6XPath、JSONPathなどによる特定要素の抽出、ETL処理 26自然言語処理(NLP)、画像認識、音声認識、機械学習(ML)10
長所・データの一貫性と品質が高い・検索、集計、分析が容易・成熟した技術とツールが豊富 5・構造化データより柔軟性が高い・非構造化データより検索性が高い・データ交換に適している 17・多様なデータを迅速に収集可能・未知のインサイト発見の可能性・将来の分析ニーズに対応可能 4
短所・事前定義された用途にしか使えない・スキーマ変更のコストが高い・多様なデータ形式に対応できない 6・管理や分析には専門知識が必要・データ品質や一貫性の担保が課題 21・そのままでは検索・分析が極めて困難・分析には高度な技術と専門知識が必要・ストレージコストが大きくなる傾向 16
代表的ユースケース財務会計、顧客管理(CRM)、販売管理、在庫管理 8Web API、設定ファイル、ログデータ、IoTデータ 21SNS感情分析、医療画像診断、予知保全、生成AIの学習データ 10

この比較表は、データ戦略における根本的なトレードオフを明確に示している。すなわち、管理の容易性と分析の効率性を追求すれば(構造化データ)、柔軟性と将来の可能性が犠牲になる。逆に、柔軟性と将来性を追求すれば(非構造化データ)、分析の複雑性と管理コストが増大する。半構造化データは、このトレードオフの中で実用的なバランスを取るための重要な選択肢となる。

2.1 データモデルとスキーマ:設計思想の根本的差異

構造化データと非構造化データの最も根源的な違いは、スキーマに対するアプローチにある。構造化データは、データを格納する前に厳格なスキーマを定義する。例えば、顧客データベースを設計する際、「電話番号」という列には15桁以内の数字しか入力できない、といったルールをあらかじめ定める。この「門番」のような仕組みにより、入力されるデータの品質と整合性が保証されるが、後から「SNSアカウント」という新しい項目を追加したくなった場合、データベース全体の設計変更が必要となり、多大なコストと時間がかかる可能性がある 6

対照的に、非構造化データはスキーマレスである。これは、あらゆる種類のデータを、その形式を問わずに迅速に受け入れる「開かれた門」を持つことを意味する 16。Eメール、動画、センサーログといった異なる形式のデータを、後でどう使うかを考えずに、まずは一箇所に集めることができる。この迅速なデータ収集能力は大きな利点だが、その代償として、データの中に誤った情報や矛盾した情報が含まれるリスク(データ品質の問題)や、そもそもデータが何を意味するのかを後から解釈する困難さが伴う 10

2.2 柔軟性とスケーラビリティ:成長への適応力

スキーマの有無は、データの柔軟性とシステムの拡張性(スケーラビリティ)に直接的な影響を及ぼす。構造化データは、その厳格な定義ゆえに、当初想定された目的(例えば、月次売上レポートの作成)には極めて効率的に機能する。しかし、そのレポートの枠を超えて、「特定の商品のレビューで言及されたキーワードと売上の相関」といった新たな分析を行おうとすると、途端に不向きとなる 6。用途が限定的であることは、構造化データの持つ最大の制約の一つである。

一方、非構造化データはネイティブ形式で保存されるため、その本質的な柔軟性から、将来現れるであろう未知の分析ニーズにも対応できる 7。今日収集した顧客からのチャットログが、5年後に開発される新しいAIモデルの貴重な学習データになるかもしれない。この将来性こそが、非構造化データを蓄積する戦略的価値である。

スケーラビリティに関しても、両者には違いが見られる。構造化データを扱う伝統的なリレーショナルデータベースは、データ量が増大すると単一サーバーの性能を上げる「垂直スケーリング」に依存することが多いが、これには物理的・コスト的な限界がある。対して、非構造化データを扱うことを前提に設計されたHadoopのような分散処理システムは、安価なサーバーの台数を増やすことで処理能力を向上させる「水平スケーリング」に優れており、ペタバイト級の巨大なデータ量にもリニアに対応することが可能である 6

2.3 保存と管理:ウェアハウス vs. レイク

データの保存場所の選択は、そのデータタイプと利用目的を色濃く反映する。この文脈で対比されるのが「データウェアハウス」と「データレイク」である。

  • データウェアハウス (DWH): 主に構造化データを格納するために設計された、分析専用のデータベースである 6。企業の様々な業務システムから収集されたデータは、分析しやすいように事前にクレンジング(不要なデータの除去)、変換、統合といった処理(ETL処理)が施された上で、DWHに格納される。これは、いわば「瓶詰めされた高品質な水」を提供する浄水場のようなものであり、ビジネスユーザーが信頼できるデータに基づいて迅速にレポートを作成し、意思決定を行うことを目的とする 2
  • データレイク: 構造化、半構造化、非構造化を問わず、あらゆる形式のデータを、加工せずにそのままの「生」の形で一元的に保存する巨大なリポジトリである 7。これは、あらゆる流れ込む水をそのまま貯めておく広大な「湖」に例えられる。その主目的は、将来の多様な分析(特にデータサイエンスや機械学習)に備えて、可能な限り多くのデータを失うことなく蓄積しておくことにある 2

この「浄水場」と「湖」の比喩は、企業のデータ戦略の成熟度と野心を示す重要な指標となる。多くの企業は、まず業務データをデータウェアハウスに集約し、現状を可視化するBI(ビジネスインテリジェンス)からデータ活用を始める。これはデータ活用の第一歩として不可欠である。しかし、市場での競争が激化し、顧客行動の予測や高度なパーソナライゼーションが求められるようになると、構造化データのみを扱うDWHの限界が明らかになる。なぜなら、顧客の真の声や市場の微細な変化といった価値ある情報の多くは、非構造化データの中に埋もれているからである 14

ここでデータレイクへの投資が戦略的な意味を持つ。データレイクは、現時点では価値が不明な非構造化データも含めて、将来の分析のために「とりあえず保存」しておくことを可能にする 29。これは、将来大きなリターンを生むかもしれない「オプション価値」への投資に他ならない。したがって、データレイクの構築は、企業がデータドリブンな意思決定から、AIドリブンな価値創造へとビジネスモデルを変革しようとしている証左と解釈できる。

2.4 検索、分析、そして活用の難易度

データの価値は、分析を通じてインサイトを引き出してこそ具現化する。この点において、両者の間には大きな隔たりが存在する。

構造化データは、その整然とした形式のおかげで、SQL(構造化問い合わせ言語)のような標準的な言語を用いて、必要なデータを容易に検索・抽出・集計できる 6。さらに、TableauやMicrosoft Power BIといったBIツールを使えば、プログラミングの知識がないビジネスユーザーでも、ドラッグ&ドロップの直感的な操作でデータを可視化し、レポートを作成することが可能である 10。この活用の容易さが、構造化データの最大の強みである。

対照的に、非構造化データの分析は本質的に複雑で、高度な技術と専門知識を要する 16。例えば、顧客からの問い合わせメールの山から「製品Aに関する不満」を抽出するには、テキストの中から意味を解析する自然言語処理(NLP)技術が必要となる。工場の監視カメラ映像から製品の欠陥を自動で発見するには、画像認識のアルゴリズムが不可欠である 10。これらの分析は、データサイエンティストやAIエンジニアといった専門家でなければ実行が難しく、これが非構造化データ活用の大きな障壁となっている 10

第3章:データ管理と分析技術のエコシステム

構造化データと非構造化データは、それぞれ異なる特性を持つため、それらを管理し、価値を引き出すための技術スタック(テクノロジーの組み合わせ)も大きく異なる。これらの技術エコシステムは、単なるツールの集合体ではなく、企業のデータガバナンスのあり方や組織文化そのものを反映している。

3.1 構造化データの世界:SQLとBIツールによる意思決定支援

RDBMSとSQL

数十年にわたり、構造化データ管理の絶対的な中核を担ってきたのが、リレーショナルデータベース管理システム(RDBMS)と、それを操作するための言語であるSQLである 6。RDBMSは、データを相互に関連付けられたテーブル(表)の集合として管理する。例えば、「顧客テーブル」と「注文テーブル」を「顧客ID」という共通のキーで結びつけることで、「特定の顧客が過去に何を注文したか」を正確に追跡できる。SQLは、このRDBMSからデータを抽出(SELECT)、追加(INSERT)、更新(UPDATE)、削除(DELETE)するための標準言語であり、データ分析の基本スキルとして広く認知されている。この確立された技術基盤が、構造化データの信頼性と安定した運用を支えている。

BIツールによる可視化と「データの民主化」

RDBMSに蓄積された構造化データは、そのままでは専門家しか扱えない。その価値を広くビジネスの現場で活用可能にしたのが、Tableau、Microsoft Power BI、Looker Studioといったビジネスインテリジェンス(BI)ツールである 33。これらのツールは、SQLを直接記述することなく、直感的なインターフェースを通じてデータベースに接続し、膨大なデータをインタラクティブなグラフやダッシュボードに変換する 36。

例えば、営業マネージャーは、BIツールを使って地域別・製品別の売上実績をリアルタイムで可視化し、目標達成率が低いエリアを特定して迅速に対策を打つことができる。マーケティング担当者は、キャンペーンの効果を日次で追跡し、広告予算の配分を最適化することが可能になる 33。このように、BIツールは専門家ではないビジネスユーザーが自らデータを探索し、インサイトを得ることを可能にすることで、「データの民主化」を力強く推進する 37。このプロセスは、主に構造化データを対象としており、経営層や現場の迅速かつデータに基づいた意思決定を強力に支援するものである 36

3.2 非構造化データの世界:ビッグデータ技術とAIによる洞察発見

非構造化データの爆発的な増加は、従来のRDBMSでは対応できない新たな課題を生み出し、それを解決するための新しい技術エコシステムを誕生させた。

NoSQLデータベース

NoSQL(”Not only SQL”)データベースは、リレーショナルモデルの制約から脱却し、非構造化データや半構造化データの管理に特化したデータベース群の総称である 12。これらはスキーマレスであり、JSONのような柔軟なデータ構造をそのまま格納できるドキュメント指向データベース(例:MongoDB)や、大規模なデータセットに対する高速な読み書きを実現する列指向データベース(例:Apache Cassandra)など、多様な種類が存在する 9。NoSQLデータベースは、その高い柔軟性と水平スケーラビリティにより、WebアプリケーションのバックエンドやIoTプラットフォームなど、変化が速く大規模なデータを扱うシステムで広く採用されている。

分散処理フレームワークの比較

ペタバイト級に達する非構造化データを単一のサーバーで処理することは不可能である。この課題を解決するのが、多数のコンピュータを連携させて一つの巨大な計算機として機能させる分散処理フレームワークである。その代表格がApache HadoopとApache Sparkである。

  • Apache Hadoop: ビッグデータ処理の草分け的存在であり、Hadoop Distributed File System (HDFS) という分散ファイルシステムと、MapReduceという並列処理モデルを基盤とする 9。Hadoopの強みは、安価な汎用サーバーを多数用いて、非常に大規模なデータを高い信頼性で、コスト効率良く処理できる点にある 25。主に、夜間に行うような大規模なバッチ処理に適している 25
  • Apache Spark: HadoopのMapReduceが処理の途中でディスクへの書き込みを多用するのに対し、Sparkはデータを可能な限りメモリ上で処理する「インメモリコンピューティング」を採用している 25。これにより、Hadoopに比べて最大100倍高速な処理性能を発揮することが可能であり、リアルタイムのデータ分析や、機械学習のような反復的な計算処理に絶大な威力を発揮する 25。また、SQL、ストリーミング処理、機械学習、グラフ計算など、多様なライブラリを統合しており、汎用性が高い点も特徴である 25

選択の指針: どちらのフレームワークを選択するかは、プロジェクトの要件に依存する。処理速度よりもコスト効率と巨大なデータのバッチ処理が最優先される場合はHadoopが適している。一方、リアルタイム性、インタラクティブな分析、そして高度な機械学習モデルの構築が求められる場合は、初期コストが高くともSparkが優位となる 25。実際には、HadoopのHDFSをストレージ基盤として利用し、その上でSparkを処理エンジンとして動かすという、両者を組み合わせた構成も一般的である 39

分析手法:AI/MLの役割

非構造化データから価値を抽出するための鍵は、人工知能(AI)および機械学習(ML)技術にある 10。自然言語処理(NLP)は、顧客レビューやSNS投稿のテキストから製品の評判や顧客の感情を分析する 10。コンピュータビジョンは、工場の製造ラインの画像から不良品を検出したり、医療画像から病変の兆候を発見したりする。音声認識は、コールセンターの通話をテキスト化し、顧客の不満の根本原因を特定するために用いられる 32。これらのAI/ML技術なくして、非構造化データの活用はあり得ない。

この構造化データと非構造化データの技術エコシステムの違いは、企業の組織文化やデータガバナンスのあり方を映し出す鏡でもある。BIツールを中心とした構造化データ活用は、多くの場合、IT部門や経営企画部門が主導し、全社共通のKPIダッシュボードを定義・展開する、トップダウンで中央集権的なアプローチを取ることが多い 34。これは「統制」と「標準化」を重視する文化であり、組織全体で一貫した指標に基づいた意思決定を可能にするが、一方で現場の自由な分析を阻害し、硬直化を招くリスクもはらむ。

対照的に、データサイエンティストがデータレイクから自由にデータを引き出し、SparkやPythonといったツールを駆使して試行錯誤を繰り返す非構造化データの分析は、ボトムアップで分散的なプロセスである 10。これは「探索」と「自律性」を重んじる文化であり、革新的な発見を生む土壌となるが、ガバナンスの欠如や分析ノウハウが個人に依存する「属人化」を招く危険性も伴う。

真にデータドリブンな組織を目指すには、単にこれらの技術を導入するだけでなく、トップダウンの統制とボトムアップの探索という、二つの異なる文化をいかにして融合させるかという組織的な課題に向き合う必要がある。例えば、探索的な分析で得られた有用なインサイトを、標準的なBIダッシュボードに昇格させて全社で共有する仕組みを構築するなど、両者の長所を活かすためのプロセス設計が不可欠となる。

第4章:戦略的活用と業界別ユースケース

理論的な理解をビジネス上の具体的な成果に結びつけるためには、データが実際の現場でどのように活用され、どのような価値を生み出しているかを知ることが重要である。本章では、特に非構造化データの重要性に焦点を当てつつ、様々な業界における構造化・非構造化データの戦略的な活用事例を詳述する。

4.1 データ比率の逆転が意味するもの:80%の非構造化データに眠る価値

現代の企業が保有またはアクセス可能なデータの80%から90%は非構造化データであるという事実は、繰り返し強調する価値がある 1。これは、もし企業が構造化データの分析だけに注力している場合、自らが持つデータ資産の大部分を未活用のまま放置していることを意味する。顧客との契約書、セールスプレゼンテーション、製品発表のビデオ、SNS上の顧客の声といった非構造化データは、文字通り「情報の宝の山」であり、そこには競争優位に直結する貴重なインサイトが眠っている 2

しかし、多くの企業において、IT関連予算の配分は依然として構造化データの管理に偏っているという調査結果もある 3。データの量と投資額の間に存在するこの著しい不均衡は、多くの企業が非構造化データの潜在価値を十分に認識できていないか、あるいは活用方法がわからずにいる現状を示唆している。この「宝の山」を無視し続けることは、顧客理解の深化や新たなビジネスチャンスの創出といった機会を逸し、データ駆動型の競合他社に対して決定的な情報的劣位を喫するリスクをはらんでいる。

4.2 業界別インサイト

構造化データと非構造化データの価値は、両者を統合的に分析することで最大化される。構造化データがビジネス活動の結果として「何が起きたか(What)」を定量的に示すのに対し、非構造化データはその背景にある文脈や理由、すなわち「なぜ起きたか(Why)」を定性的に解き明かすための手がかりを提供する。この二つを組み合わせることで、単なるデータ分析は、具体的なアクションに繋がる「ビジネスストーリーテリング」へと昇華する。

小売・Eコマース

  • 構造化データの活用: POSシステムから得られる販売データや、CRMシステムに蓄積された顧客の購買履歴は、構造化データの典型的な活用例である 8。BIツール(例えばTableau)を用いてこれらのデータを分析することで、どの商品が、どの店舗で、どの顧客層によく売れているかを正確に把握できる。これにより、在庫の最適化や効果的な販売促進キャンペーンの立案が可能となる 40
  • 非構造化データの活用: 顧客がSNSやレビューサイトに投稿する製品レビューやコメントは、非構造化データの宝庫である 8。これらのテキストデータを自然言語処理技術を用いて感情分析することで、顧客が製品のどの点に満足し、どこに不満を抱いているのか、その具体的な理由を深く理解することができる 18。これは、製品改善や新たな商品開発のための貴重なヒントとなる。
  • 統合活用による相乗効果: ある商品の売上が急落したという事実(What)がPOSデータ(構造化)から判明したとする。しかし、その理由(Why)はこのデータだけではわからない。ここで、同時期のSNS上の投稿(非構造化)を分析すると、「商品のパッケージデザインが変更され、不評を買っている」という消費者の生の声が発見されるかもしれない。この二つのデータを統合することで、「パッケージ変更が原因で売上が20%減少した」という、因果関係を含んだ実行可能なインサイト(Actionable Insight)が得られ、迅速な対応(例:デザインの再変更)に繋げることができる。

製造業

  • 構造化データの活用: 生産管理(MES)システムや企業資源計画(ERP)システムから得られる生産実績、品質検査結果、部品在庫といったデータは、製造業における構造化データの中核をなす。BIツール(例えばPower BI)を用いてこれらのデータを可視化し、生産計画と実績の差異をリアルタイムで監視することで、生産効率の向上を図ることができる 43
  • 非構造化データの活用: 近年、製造業ではIoTの活用が進んでいる。工場の生産ラインに設置されたセンサーから収集される振動、温度、圧力といった時系列データや、監視カメラの映像は、典型的な非構造化データである 45。これらのデータをAIでリアルタイムに分析することで、設備の故障の兆候を事前に検知する「予知保全」や、製品の微細な欠陥を自動で発見する品質管理の高度化が可能となる 44
  • 統合活用による相乗効果: 特定の製品ロットで不良品率が上昇した(What)という品質検査データ(構造化)が得られた場合、そのロットが生産されていた時間帯のセンサーログや設備の稼働記録(非構造化)を突き合わせる。これにより、「特定の機械のモーター温度が異常値を示した後に不良品が増加している」といった根本原因(Why)を特定し、再発防止策を講じることが可能になる。

金融

  • 構造化データの活用: 顧客の口座情報、入出金記録、クレジットカードの利用履歴といったトランザクションデータは、金融機関が保有する最も重要な構造化データである 8。これらのデータを分析し、過去の不正利用のパターンと類似した取引を検出することで、リアルタイムの不正検知システムを構築できる。
  • 非構造化データの活用: コールセンターに寄せられる顧客との通話録音データや、問い合わせメールのテキストは、顧客の不満や新たな金融商品へのニーズを把握するための貴重な情報源である 14。音声認識技術で通話をテキスト化し、NLPで分析することで、解約の兆候がある顧客を早期に特定したり、新しいサービスのアイデアを得たりすることができる。
  • 統合活用による相乗効果: ABN AMRO銀行の事例に見られるように、先進的な金融機関では、膨大な市場の取引データ(構造化)と、金融ニュース、アナリストレポート、SNS上の市場センチメント(非構造化)を組み合わせて分析する 47。これにより、個別の金融商品のリスク評価だけでなく、マクロ経済の動向が自社のポートフォリオに与える影響をより高度に予測し、精緻なリスク管理と投資戦略の立案を実現している。

4.3 特殊応用例:SEOにおける構造化データの役割とビジネス効果

これまで述べてきたデータベース管理の文脈とは少し異なるが、「構造化データ」という用語がWebマーケティング、特に検索エンジン最適化(SEO)の分野で特殊な意味を持って用いられている点にも触れておく必要がある。

ここでの構造化データとは、WebページのHTMLコード内に、そのページの内容を検索エンジン(例:Google)に明確に伝えるための特定の形式(ボキャブラリーとシンタックス)で記述されたメタデータを指す 48。例えば、レシピサイトのページに「調理時間:30分」「カロリー:500 kcal」といった情報を構造化データとして埋め込むことで、検索エンジンは単なるテキストとしてではなく、それが「調理時間」や「カロリー」という特定の意味を持つ情報であることを正確に理解できる 49。このマークアップには、JSON-LD、Microdata、RDFaといった形式が用いられる 48

この施策がもたらすビジネス上の直接的な効果は、検索結果の表示を豊かにする「リッチリザルト」である 48。構造化データが適切に実装されたページは、通常の検索結果に加えて、評価の星(レビュー)、価格、在庫状況、イベントの日時といった付加情報が表示されることがある 50。これらの目立つ表示は、他の検索結果との差別化を図り、ユーザーのクリック率(CTR)を向上させる効果が期待できる。これは直接的な検索順位の上昇には繋がらないとされるが、結果としてWebサイトへのトラフィックを増加させ、間接的なSEO効果とビジネス機会の拡大に貢献する重要な施策である 50

第5章:未来展望:AI時代におけるデータ活用の進化

データ活用のパラダイムは、現在、人工知能(AI)、特に生成AIの急速な台頭によって、かつてない規模の地殻変動を経験している。この変化の核心にあるのは、非構造化データの価値と役割の根本的な再定義である。本章では、AIがデータ活用の未来をどのように描き変えつつあるかを探る。

5.1 生成AIと大規模言語モデル(LLM)の燃料としての非構造化データ

ChatGPTに代表される大規模言語モデル(LLM)や、画像・音声を生成するAIモデルは、その驚異的な能力を、膨大で多様な非構造化データを学習することによって獲得している 10。インターネット上のテキスト、書籍、画像といった公開データがその基盤となっているが、真の競争優位性は、企業が独自に保有する非構造化データの中に眠っている。

汎用的なLLMは、いわば「博識な一般人」に過ぎない。しかし、この汎用LLMを、自社が長年にわたり蓄積してきた技術文書、顧客との対話ログ、過去のプロジェクト報告書、社内マニュアルといった独自の非構造化データで追加学習(ファインチューニング)させることで、「自社の業務に精通した専門家」へと変貌させることが可能になる 3。この自社特化AIは、他社には決して模倣できない独自の知識と文脈を理解し、より高精度な業務支援(例:専門的な顧客からの問い合わせへの自動応答、複雑な契約書の危険条項の特定、過去の事例に基づいたプレスリリースのドラフト作成など)を実現する 3

この文脈において、非構造化データは単なる分析対象から、企業の知的資産をAIに注入し、持続的な競争優位性を生み出すための最も価値ある「戦略的資源」へとその地位を高めている。これまでコストセンターと見なされがちだった非構造化データの蓄積・管理が、将来の企業価値を左右する最重要の投資活動へと変貌しつつあるのである。データの価値評価基準そのものが、このAI時代において根本的にシフトしていると言える。

5.2 検索拡張生成(RAG)に見る両データの協調

生成AIの課題の一つに、学習データに含まれない最新の情報や、社内の非公開情報について回答できない点、そして時として事実に基づかない情報を生成してしまう「ハルシネーション(幻覚)」のリスクがある。この課題を克服する最先端の技術として注目されているのが、RAG(Retrieval-Augmented Generation:検索拡張生成)である。

RAGは、LLMがユーザーからの質問に回答を生成する際に、まず外部の信頼できる知識ベース(データベース)をリアルタイムで検索し、そこで得られた関連情報を参照しながら回答を生成する仕組みである 10。この知識ベースには、社内の製品マニュアルや過去のトラブルシューティング事例(非構造化データ)と、最新の製品在庫数や顧客の契約状況(構造化データ)の両方が含まれうる。

例えば、「顧客A向けの製品Bの最新の納期は?」という質問に対し、RAGシステムはまず顧客管理データベース(構造化)から顧客Aの契約情報を、在庫管理システム(構造化)から製品Bの在庫状況を取得し、さらに製品マニュアル(非構造化)から標準的なリードタイムを検索する。そして、これらの情報を基にLLMが「顧客A向けの製品Bは現在在庫があり、標準リードタイムを考慮すると、最新の納期はX月Y日となります」という、正確で信頼性の高い回答を生成する。このように、RAGは構造化データと非構造化データを動的に連携させ、AIの応答の質を飛躍的に向上させる、両データの協調が生み出す未来の姿を象徴する技術である。

5.3 データ統合の挑戦:構造化と非構造化のサイロをいかに乗り越えるか

AI時代におけるデータ活用のポテンシャルを最大限に引き出すためには、構造化データと非構造化データが組織内で分断されている「サイロ」の状態を克服することが不可欠である。しかし現実には、構造化データはデータウェアハウスに、非構造化データはデータレイクに格納され、それぞれ異なる部門(例:BIチームとデータサイエンスチーム)によって管理されていることが多い。この組織的・技術的なサイロが、RAGのような統合的なデータ活用を妨げる大きな障壁となっている。

この課題に対応するため、モダンデータスタック(Modern Data Stack)、データファブリック、データメッシュといった新しいデータアーキテクチャの思想が提唱されている。これらのアプローチに共通するのは、物理的なデータの保存場所を問わず、組織内の誰もが必要なデータに安全かつ容易にアクセスできる、統合的で分散的なデータ基盤を構築しようという思想である。データの所有権を事業部門に分散させる(データメッシュ)など、組織論的な変革も伴うこれらの取り組みは、データサイロを乗り越え、組織全体でデータをシームレスに活用するための次世代のスタンダードを目指している。

5.4 メタデータ管理の重要性と将来のデータマネジメント

データの種類が多様化し、その量が指数関数的に増大する中で、データそのものと同じくらい、あるいはそれ以上に重要になるのが、「データに関するデータ」、すなわちメタデータの管理である 8。メタデータには、データの作成者、作成日時、データ形式、データの意味内容を説明するタグや定義、データの品質情報、アクセス権限など、データを理解し、適切に利用するために不可欠な情報が含まれる。

特に、混沌とした非構造化データの「湖(データレイク)」の中から、目的のデータを効率的に発見し、そのデータの出自や信頼性を評価するためには、整備されたメタデータが羅針盤としての役割を果たす 8。優れたメタデータ管理は、データの発見可能性(Discoverability)を高め、データガバナンスを効かせ、コンプライアンスを遵守する上での基盤となる。AIが自律的にデータを探索し、活用する未来を見据えれば、AIが理解できる形式でメタデータを整備しておくことの戦略的重要性は、今後ますます高まっていくだろう。

第6章:結論と戦略的提言

本レポートでは、構造化データと非構造化データについて、その定義、特性、技術エコシステム、そして戦略的活用に至るまで、多角的な視点から詳細な分析を行ってきた。その分析を通じて得られた主要な洞察を再確認し、データ駆動型のビジネス戦略を立案するリーダーが取るべき具体的なアクションを提言する。

6.1 主要な洞察の再確認

本レポートの分析から導き出された核心的な洞察は、以下の四点に集約される。

  1. 特性と思想の根本的差異: 構造化データと非構造化データの違いは、単なる技術的な形式の差に留まらない。それは、データを扱う際の根底にある思想、求められる組織文化、そして最終的にもたらされるビジネス価値の性質において、根本的に異なるパラダイムを代表している。前者は「管理と統制」による効率化を、後者は「収集と発見」による革新を志向する。
  2. データ活用における成熟度の進化: 企業のデータ活用は、多くの場合、構造化データを用いたBIによる「現状把握」から始まる。しかし、真の競争力を獲得するためには、その段階に留まることなく、非構造化データを活用して未来のトレンドや顧客の深層心理を探る「未来創造」のステージへと進化していく必要がある。企業のデータ戦略は、この成熟度の階段をいかにして登っていくかというロードマップとして描かれなければならない。
  3. 統合分析による価値の最大化: 最も高度でインパクトの大きいインサイトは、構造化データと非構造化データを個別に分析するのではなく、両者を統合し、相関関係や因果関係を探ることで生まれる。構造化データが示す「何が起きたか(What)」という事実に、非構造化データが提供する「なぜ起きたか(Why)」という文脈を結びつける能力こそが、データから実行可能なアクションを導き出すための核心的なケイパビリティである。
  4. AI時代における価値の転換: 生成AIの登場は、データの価値序列に地殻変動をもたらした。これまで直接的なビジネス価値に結びつけやすいとされてきた構造化データに加え、他社が模倣不可能な独自の知識と文脈を含む非構造化データが、自社特化のAIを育成し、持続的な競争優位性を築くための最も重要な「戦略的資源」として再評価される時代が到来した。

6.2 データ戦略立案に向けたアクションプラン

上記の洞察に基づき、データ資産の価値を最大化し、将来の競争に備えるための戦略的なアクションプランを以下に提言する。

提言1:自社のデータ資産の棚卸しと分類

データ戦略の第一歩は、現状を正確に把握することである。まず、社内の各部門、各システムに、どのような構造化データと非構造化データが、どのような形式で、どこに点在しているのかを徹底的に調査し、可視化する「データマッピング」を実施するべきである。その上で、各データ資産をカタログ化し、そのビジネス上の価値や潜在的な活用可能性を評価する。

提言2:目的に応じた技術スタックの選定(ハイブリッドアプローチの推奨)

万能な技術は存在しない。定型的なレポーティングや業績管理といった「既知の問い」に答えるためには、データウェアハウスとBIツールを中心とした安定的な基盤が依然として有効である。一方で、探索的な分析、未知のパターンの発見、AIモデルの開発といった「未知の問い」に挑むためには、データレイク、Sparkや各種MLプラットフォームを組み合わせた、柔軟でスケーラブルな基盤が必要となる。これらを排他的に捉えるのではなく、ビジネスの目的に応じて最適なツールを組み合わせ、両者が連携できるハイブリッドなデータ基盤を構想することが賢明である。

提言3:非構造化データ活用に向けた人材育成と組織体制の構築

非構造化データの活用には、高度な専門知識が不可欠である。データサイエンティストやAIエンジニアといった専門人材の採用・育成に戦略的に投資することが求められる 53。しかし、それだけでは不十分である。ビジネス部門の現場担当者が非構造化データの価値を理解し、自らの課題をデータサイエンティストに的確に伝え、協働できるようなデータリテラシー教育が全社的に必要となる。また、部門の壁を越えてデータと知見を共有できる、組織横断的なプロジェクト体制の構築も不可欠である。

提言4:メタデータ管理への戦略的投資

非構造化データという広大な「カオス」に秩序をもたらし、その価値を引き出すための鍵はメタデータにある。データカタログやメタデータ管理ツールへの投資を優先し、社内の誰もが「どのようなデータがどこにあるのか」を容易に発見でき、そのデータの信頼性や利用条件を理解できる環境を整備するべきである。これは、データガバナンスを確保し、コンプライアンスリスクを低減するだけでなく、組織全体のデータ活用効率を飛躍的に向上させるための、最も費用対効果の高い投資の一つである。

引用文献

  1. 非構造化データとは – テラデータ https://www.teradata.jp/glossary/what-is-unstructured-data
  2. 構造化データと非構造化データ: 5つの主な違い | Integrate.io https://www.integrate.io/jp/blog/structured-vs-unstructured-data-key-differences-ja/
  3. 企業が持つ情報の90%は非構造化データ ~ そこに眠る無限の価値 … https://www.boxsquare.jp/blog/information-companies-unstructured-data
  4. 非構造化データとは?構造化データとの違いや課題についてわかりやすく解説! – データのじかん https://data.wingarc.com/unstructured-data-52998
  5. solution.toppan.co.jp https://solution.toppan.co.jp/bx/contents/cdp_contents07_0831.html#:~:text=%E6%A7%8B%E9%80%A0%E5%8C%96%E3%83%87%E3%83%BC%E3%82%BF%E3%81%A8%E3%81%AF%E3%80%81Excel%E3%82%84CSV%E3%83%95%E3%82%A1%E3%82%A4%E3%83%AB%E3%81%AB,%E9%81%A9%E3%81%97%E3%81%9F%E3%83%87%E3%83%BC%E3%82%BF%E6%A7%8B%E9%80%A0%E3%81%A7%E3%81%99%E3%80%82
  6. 構造化データとは何ですか? – AWS https://aws.amazon.com/jp/what-is/structured-data/
  7. 構造化データと非構造化データの比較:完全ガイド – Talend https://www.talend.com/jp/resources/structured-vs-unstructured-data/
  8. 構造化データとは? – Elastic https://www.elastic.co/jp/what-is/structured-data
  9. 非構造化データ – Wikipedia https://ja.wikipedia.org/wiki/%E9%9D%9E%E6%A7%8B%E9%80%A0%E5%8C%96%E3%83%87%E3%83%BC%E3%82%BF
  10. 構造化データと非構造化データの違い – IBM https://www.ibm.com/jp-ja/think/topics/structured-vs-unstructured-data
  11. 非構造化データとは – 定義と意味 – NetApp https://www.netapp.com/ja/data-storage/unstructured-data/what-is-unstructured-data/
  12. 構造化データと非構造化データ |ピュア・ストレージ – Pure Storage https://www.purestorage.com/jp/knowledge/big-data/structured-vs-unstructured-data.html
  13. 構造化データと非構造化データの違いとは?それぞれの特徴も含め解説 – クロス・マーケティング https://www.cross-m.co.jp/column/data_marketing/dtm20220520
  14. 基本から学ぶデータの種類:構造化データと非構造化データの違い – コンタクトセンターの森 https://www.cloud-contactcenter.jp/blog/difference-between-structured-data-and-unstructured-data.html
  15. Unstructured data | 非構造化データ – Cohesity https://www.cohesity.com/jp/glossary/unstructured-data/
  16. 構造化データと非構造化データの違いは何ですか? – AWS https://aws.amazon.com/jp/compare/the-difference-between-structured-data-and-unstructured-data/
  17. 構造化データと非構造化データの違いは?長所や注意点についても解説! https://www.softbanktech.co.jp/corp/hr/recruit/articles/118/
  18. 非構造化データとは? – Elastic https://www.elastic.co/jp/what-is/unstructured-data
  19. waha-transformer.com https://waha-transformer.com/glossary/060.html#:~:text=%E5%8D%8A%E6%A7%8B%E9%80%A0%E5%8C%96%E3%83%87%E3%83%BC%E3%82%BF%E3%81%A8,%E4%BB%A3%E8%A1%A8%E7%9A%84%E3%81%AA%E4%BE%8B%E3%81%A7%E3%81%99%E3%80%82
  20. 半構造化データ(XML/JSON) – みんなのデータサイエンス https://minnanods.com/semi-structured-data/
  21. 半構造化データとは?構造化データや非構造化データとの違いやメリット、課題についても解説 https://primenumber.com/blog/semi_structured_data
  22. 半構造化データとは|「分かりそう」で「分からない」でも「分かった」気になれるIT用語辞典 https://wa3.i-3-i.info/word18731.html
  23. JSONとXMLの違い、特徴と比較 #半構造化データ – Qiita https://qiita.com/UKI_datascience/items/98a3a1845d4d046fbe50
  24. 半構造化データでサポートされている形式 – Snowflake Documentation https://docs.snowflake.com/ja/user-guide/semistructured-data-formats
  25. Hadoop vs Spark: ビッグデータ対決 – Wallarm https://www.wallarm.com/jp/cloud-native-products-101/hadoop-vs-spark-big-data-processing
  26. AWSを活用したアドホックデータ分析入門 – TechHarmony https://blog.usize-tech.com/aws-ad-hoc-data-analysis/
  27. 非構造化データはなぜ重要?構造化データとの違いや分析・管理方法も解説 – primeNumber https://primenumber.com/blog/unstructured-data
  28. AWSでデータレイクを構築するには? – 株式会社スタイルズ https://www.stylez.co.jp/aws_columns/bi_dwh_and_data_lake_in_aws/how_to_build_a_data_lake_in_aws/
  29. データレイクとは何ですか? – 分析 – AWS https://aws.amazon.com/jp/what-is/data-lake/
  30. 構造化データ vs 非構造化データ:5つの主な違い – Qiita https://qiita.com/Integrateio/items/c97ffed2f074dc11d266
  31. 構造化データと非構造化データの違い – DATA VIZ LAB|データビズラボ https://data-viz-lab.com/structureddata
  32. Amazon SageMaker による非構造化データ処理の自動化 – AWS Startups https://aws.amazon.com/startups/learn/automating-unstructured-data-processing-with-amazon-sagemaker?lang=ja
  33. BIツールでマーケティングのデータ分析!活用術・おすすめツール7選を紹介 – AD EBiS https://www.ebis.ne.jp/column/bi-tools/
  34. 【2025年】BIツール比較22選 わかりやすい種類・機能・選び方まとめ | BOXIL Magazine https://boxil.jp/mag/a70/
  35. 【目的別】おすすめのデータ分析ツール17選 | 機能や選び方もあわせて紹介 – スキルアップAI https://www.skillupai.com/blog/ai-knowledge/data-analysis-tools/
  36. BIツールとは?基本から仕組みまでかんたん図解 – LaKeel BI – ラキール https://bi.lakeel.com/course/detail01/
  37. ビジネス インテリジェンス ツール | Microsoft Power BI https://www.microsoft.com/ja-jp/power-platform/products/power-bi/topics/business-intelligence/business-intelligence-tools
  38. ビジネスインテリジェンスと機械学習 – データ分析の形式の違い – AWS https://aws.amazon.com/jp/compare/the-difference-between-business-intelligence-and-machine-learning/
  39. Hadoop と Spark の比較 – アパッチフレームワークの違い – AWS https://aws.amazon.com/jp/compare/the-difference-between-hadoop-vs-spark/
  40. Tableau導入事例厳選10選!Tableauの特徴と強みを徹底解説 – エッジワーク https://edge-work.com/column/2095/
  41. 【2025】Tableauの導入事例5選!実際の効果や企業が導入した理由を調査 | Weeeb https://weeeb.jp/data/tableau/dounyuzirei/
  42. 非構造化データとは?構造化データとの違い|具体的なユースケースと活用における課題 https://staff.persol-xtech.co.jp/hatalabo/it_engineer/673.html
  43. BIの活用で製造現場のデータ活用を促進!三島食品の工場見える化事例 [ ITレポート ] – 内田洋行 https://www.uchida.co.jp/system/report/20240014.html
  44. 製造業でデータをどう見る?ExcelとBIツールの使いどころ – S-mile(ミル) https://s-mile.jp/tech-blog/faanddata-01/
  45. Power BIの導入事例10選と効果について徹底解説 – HBLAB JSC https://hblab.co.jp/blog/power-bi-introduction-example/
  46. 製造業(工場)向けBIツールおすすめ7選比較! https://www.shopowner-support.net/attracting_customers/btob-business/bi-tool-for-manufacturing/
  47. Pentaho 成功案例:金融服務機構選擇Hitachi Vantara’s Pentaho 平台- 歐立威科技 https://www.omniwaresoft.com.tw/usecase/pentaho-usecase/pentaho_financial_services/
  48. 構造化データとは?非エンジニアでもよくわかる、初心者向け徹底解説! https://www.seohacks.net/blog/1191/
  49. 構造化データ マークアップとは | Google 検索セントラル | Documentation https://developers.google.com/search/docs/appearance/structured-data/intro-structured-data?hl=ja
  50. 構造化データとは?メリットや種類・マークアップ・ツールなど初心者にわかりやすく解説! – SEOラボ https://devo.jp/seolaboratory/95442/
  51. 【セッションレポート】AI アプリケーションのためのデータエンジニアリング戦略 – Amazon Bedrock で実現する構造化データ活用 #AWS Summit Japan 2025 | NHN テコラス Tech Blog | AWS https://techblog.nhn-techorus.com/archives/40392
  52. メタデータとは?3分でわかるデータマネジメント【メタデータ管理】 | 株式会社データ総研 https://jp.drinet.co.jp/blog/datamanagement/metadata_management_3minutes
  53. 非構造化データとは?構造化データとの違いや活用の重要性を解説 – セラク https://www.seraku.co.jp/tectec-note/industry/use_unstructureddata/