NTTテクノクロス株式会社

tasokarena

高度なデータ利活用を実現する匿名加工情報作成ソフトウェア「tasokarena」

(2022年3月号掲載)

NTTテクノクロスは、個人情報を法令に従って匿名加工情報※1への適切な加工を支援するソフトウェア「tasokarena」(タソカレナ。以下、本製品)を提供しています。NTT研究所の匿名化技術を活用した本製品のネーミングは、古語「誰 (た) そ彼 (かれ)」=「人の見分けがつかない」に由来しています。特定の個人を識別できないようにパーソナルデータを加工することにより、お客様の新しいビジネスやサービスの創出を支援します。

高度なデータ利活用を実現する匿名加工情報作成ソフトウェア「tasokarena」

 

 

パーソナルデータ利活用における
課題解決と促進支援 

2017年5月30日、改正個人情報保護法が全面施行され、個人情報を「匿名加工情報」にすれば本人から同意を得なくても、目的外利用や第三者への提供が可能となりました。これにより、パーソナルデータを利活用し、新規ビジネスやサービス創出を図ろうとする機運が高まりました。しかし、パーソナルデータの利活用にあたっては、社内外に情報を共有する際のセキュリティ上の懸念、検証段階での大きな設備導入は困難、といった課題があります。本製品は、こうした課題を解決し、パーソナルデータ利活用の促進を支援することを目的として2018年7月から提供を開始しました。。毎年バージョンアップを重ね、2021年11月から新バージョンV4を提供しています(図1)。

図1「tasokarena」概要

 

匿名性と有用性のバランスを考慮し
利用価値の高い匿名化加工情報を生成

匿名加工情報を作成する際には、利用目的に応じて「匿名性=どれだけ個人特定のリスクが低減されているのか」と「有用性=どれだけ元データの特徴が保持されているのか」のバランスを考える必要があります。なぜなら、個人の特定を避けるためにデータを加工すればするほど匿名性は上がりますが、データ分析に必要な情報が削られるため有用性は下がってしまうからです。本製品は、匿名性と有用性のバランスを保つ評価機能を搭載しています。NTT研究所特許技術であるPk-匿名化※2を含む数十種類の加工技法を使用することでデータ分析を考慮した利用価値の高い匿名化加工情報の生成が可能です。
本製品は、直観的な画面操作により実行できます。具体的には、加工操作画面上のメインメニューから操作を選択、豊富な加工技法ボタンから加工ルールを設定すると、加工前・加工後のデータがそれぞれの表示エリアに表示されます(図2)。匿名性と有用性のバランスの評価結果は円グラフでわかりやすく確認することができ、得られたデータに問題があれば、再度加工ルールを設定します。このように加工と評価を繰り返し実施することで、高度なデータ利活用を実現します。

 

お客様のご要望に応じた
2つのラインナップと付属ツール

◆スタンダード版
 〜匿名加工を手軽に実施したいお客様向け
・スタンドアロンPCでの動作が可能
・CSVファイルでのデータの入出力が可能
・GUI画面で加工対象ファイルの選択・加評価の実行が可能
・加工後の匿名性・有用性の評価が可能
・60万円/年、5ユーザライセンス

◆エンタープライズ版
 〜匿名加工を本格的・継続的に実施したいお客様向け
 スタンダード版の機能に加え、以下の機能を有します。
・データベース形式でのデータの入出力が可能
・加工・評価のコマンド実行が可能
・スケジューリングに合わせて定期的な加工実行が可能
・ルール化した加工技法に従った加工及び加工結果の評価を自動で実行
・データサイズ最大毎月300GB:180万円/年
・データサイズ制限なし:300万円/年
また、本製品は最低限の統計を確認する機能を実装していますが、お客様が既に保有されているBIツールと連携させてデータ利活用の幅を広げることも可能です。さらに付属ツールとして、自由記述文(フリーテキストデータ)に含まれる個人情報を自動的に削除・変換するマスキングツールや、パーソナルデータの属性情報をAI機能が推定し、属性情報から適用を検討すべき加工ルールを提案する加工ルール自動生成ツールもご用意しています。

図2 加工操作画面イメージ

 

合成データ生成機能追加により
パーソナルデータ利活用の可能性を拡大

本製品の主な特長は、①導入のしやすさ、②豊富な加工技法と評価機能、③自由記述文の個人情報を削除するマスキングツール、にあります。新バージョンV4では、匿名性やプライバシーを保護しつつ、元のパーソナルデータの特微量※3や統計量・分布を基に“実在はしないけれども具体的なパーソナルデータ”を生成する「合成データ生成機能」を追加しました。この機能により、元のパーソナルデータの性質を保持する架空のデータから緻密なデータ分析が可能となります。また、少ないデータから匿名化された大量のデータを生成できるため、膨大なデータを必要とするAIの学習や訓練等にも活用することができます。

 

様々な分野での利用シーン

本製品は、医療・金融・自治体・教育・コールセンタ等さまざまな分野への導入実績があります。新薬の研究開発や副作用の発見、医薬品の安全対策の向上を目的に病院等のデータ保有者が製薬会社に匿名加工情報を提供(図3)したり、新規顧客囲い込み/リピータ顧客増施策の検討、商品の販売・出品計画、新商品の開発計画を目的にクレジットカード会社が商品製造メーカに匿名加工情報を提供したり、といった利用シーンが考えられます。

図3 医療分野における利用イメージ

 

※1 匿名加工情報:個人を特定の識別することができないように加工して得られる個人に 関する情報。
 ※2 Pk-匿名化技術:データの一部分を確率的に書き換えるランダム化の処理と、元の状態を推定する再構築という処理により、理論的にk-匿名性を満たしつつ、元のデータの統計的性質をなるべく保った有用性の高いデータを作成。
 ※3 特微量:分析すべきデータや対象物の特徴・特性を、定量的に表した数値。

NTTテクノクロス
セキュアシステム事業部  第三ビジネスユニット

【左】 マネージャー  角田 進
【中央】アシスタントマネージャー 小林 千夏
【右】 エンジニア 植松 早紀

お問合せ先

NTTテクノクロス株式会社 セキュアシステム事業部 第三ビジネスユニット
https://ntt-tx.macld.net/member_web/enqueteAnswer/?ID=anontool