查看原文
其他

【金猿产品展】美创科技暗数据发现与分类分级系统——数据透明化、有序化、价值最大化、流程自动化系统

数据猿 2022-12-19





美创科技产

本产品由美创科技投递并参与“数据猿年度金猿策划活动——2022大数据产业创新服务产品榜单及奖项”评选

‍数据智能产业创新服务媒体

——聚焦数智 · 改变商业






美创科技暗数据发现和分类分级系统是一款对数据进行发现并进行自动化识别、分析和分类分级的产品。平台致力于认识数据,识别数据格式和业务含义,并根据分类分级标准实现数据的分类分级,最终生成完整、多维、可视化分析报告,帮助企业快速了解和认识数据,为开展数据资产管理、数据安全治理、数据安全防护等提供基础。


平台支持多种数据源,包括关系型数据库、大数据平台、云数据库等,并引入自然语言处理、统计模型、特征分析、机器学习等方法,提供资产发现清单和报告导出功能以及标准的数据接口服务;针对不同的行业设置了专业的行业模型,使得数据分析更加专业和准确。

2022年重大更新升级


1、多款行业版本发布,包括医疗行业、个人信息保护版本、农商行版、人社版本,内置行业核心业务系统字段含义,产品开箱即用,高自动识别率,建设周期缩短80%,实现最优性价比。

2、数据识别能力不断提升:通过字段注释进行NLP分析,通过对字段内容进行特征工程建模,大幅提升数据业务类别识别的准确度。

3、全局数据分类分级报告,以可视化方式帮助用户全局掌握分类分级情况。

4、丰富接口功能,可将数据发现和分类分级的能力和结果提供给三方系统,实现分类分级结果在数据安全治理、数据分级分类、数据资产管理等方面进行协作,更大的发挥数据的利用价值。

5、提升重要数据的识别能力,通过产品内置重要数据识别规则,快速识别重要数据。

5、新增多款关系型数据库、国产数据库、大数据平台适配类型,通过广泛的适配各种各样的数据源扫描相关数据,充分利用数据库内的数据信息进行统计分析,从而可以得到全面的关于数据分布、规模、种类的分析结果。

应用场景/人群



场景一、敏感数据发现与打标:用户在有大量数据与文件在云端、不知道其中有多少敏感数据、敏感数据分布在哪里等。暗数据发现与分类分级系统预设规则,自动发现(数据库和数据仓库)敏感数据,对其进行分类分级,标记特定安全级别,方便进行不同粒度和级别的安全管理。

场景二、暗数据发现与识别:用户有大量不易发现、不可理解、未被使用的暗数据,存储成本高且存在安全盲点。暗数据发现与分类分级在授权范围内,自动探查数据存储位置,发现数据库数量、iP、端口、类型等信息,自动捕获元数据,完善对数据的解释、定义,梳理数据间关系,形成信息标准。

场景三、数据分类分级:传统先梳理现有数据,再结合人工方式进行分类分级既不全面,效率低、周期长且主观性强、准确性差、无规范依据。美创暗数据发现与分类分级系统内置行业模版,自动完成数据分类分级,生成数据目录,提供完整、全面、直观可视化报告,保证规范、提升标准和效率,缩短项目周期,减少人工成本。

场景四、数据分类管理:组织数据安全管控和数据开放共享策略以及各项管理制度需要依托数据分类分级进行针对性制定。暗数据发现与分类分级支持通过目录的方式查看各个业务类级别下的敏感数据、敏感字段、敏感等级等,帮助对数据安全风险整体评估,丰富的对外接口便于方便承接后续工作。

产品功能


1、资产分类分级总览

用户通过资产发现作业对数据含义进行智能识别并自动分类分级,发现的结果支持以分类分级目录形式查看数据资产的分类分级情况。

2、资产发现总览

提供一个统一的入口,能够对完成资产发现作业的数据源的字段发现情况和分类分级情况进行展示。以分组-数据源-schema-表的维度,展示不同对象下的数据分类分级和敏感数据信息。

3、资产发现

实现自动化的元数据信息获取,通过多维度的数据特征解析数据含义,以及完成对数据分类和分级。

① 发现作业配置:在开展资产发现作业之前,可按照用户的发现要求进行相应的配置,包括数据范围的灵活选择,可选择数据库、schema、表等粒度进行发现;可灵活配置发现内容,包括发现模版,抽样行数、命中率要求等,此外还支持设置定时调度和调整发现作业中的基础参数。

② 业务类型解析:根据内置的数据标准,可以实现自动识别数据格式,在此基础之上,通过自然语言处理、特征分析等方法对扫描过的数据进行语义内容识别,分析字段的业务类型,帮助用户快速和深入认识数据代表的含义。

③ 数据分类分级:在选定发现模板的基础上,在完成字段业务类型的识别后,会自动输出对应的分类和分级信息,实现对数据的分类和分级,明确数据按照业务的分类情况、按照重要程度和敏感程度的分级情况。用户可以筛选分级,查看不同敏感程度的数据分布和信息。用户可以筛选分类,查看不同分类下数据的分布和信息。用户可根据自动化的分类分级的结果,定位敏感数据和重要数据,从而对敏感数据采取相应的安全防护措施,包括敏感数据访问审计、数据脱敏等,实现敏感数据的保护。

④ 发现结果清单:全部资产发现以及数据分析结束后,系统会生成资产发现清单,包括字段的业务信息和分类分级信息,以及敏感表格的信息。支持用户对结果进行导出进行后续的输出和利用。

⑤ 分类分级报告:数据分类分级完成后会生成相应的数据分类分级报告,包括数据总览、数据分类统计、业务类型数量排序、数据分级统计等,通过可视化报表的方式帮助用户直观了解到数据分类和分级的信息,并支持报表的导出。

⑥ 分类分级大屏:在完成数据资产梳理及分类分级工作侯,系统会将整体的梳理结果以大屏的形式进行展现,包括数据资产的盘点、数据分类分级概况、数据敏感分析、数据库差异分析等,从多个维度和视角进行同意展现。满足向上汇报及外部参观的展示需求。

4、数据源管理

① 数据源配置:数据源管理模块,用户可通过选择数据源类型填写连接信息,将企业内部的数据库、大数据平台或者云数据库等添加为系统数据源进行统一管理。提供手动添加、批量导入、数据源发现三种方式。对于连接成功的数据源,支持用户开展资产发现作业。

② 数据源自动发现:要进行数据资产盘点、进行数据发现,首先需要明确数据在哪里。但是实际情况,企业内部数据分散、业务系统复杂,用户以为自己有10个库,可能实际上有更多的库。数据源自动发现的功能,支持用户输入IP范围,通过扫描IP范围的方式去自动化发现企业内部有多少数据库,包括数据库的IP、端口、数据库类型等信息。支持用户定时开展数据源资产发现作业。支持对发现结果进行导出。用户可选择不同时间的数据源自动发现结果进行对比分析,情况查看数据库类型分布、数据库IP分布、数据库变化等信息,及时发现数据库新增和变化。支持对对比分析结果进行导出。支持用户上传数据库台账信息,与系统发现结果进行对比,定位数据资产信息变化。

5、资产发现配置

① 发现模板管理:支持用户创建发现模板并进行内容的维护,在用户设定的分类分级标准的基础上选择需要发现的字段业务类型。例如只选择特定的敏感数据类型,进行敏感数据发现,在进行资产发现时可选择发现模板来自定义需要发现的内容。

② 数据字典管理:系统提供数据字典导入的功能,用户可通过手动新增和按照模版批量导入的方式添加数据字典。添加完成的数据字典可作为自定义业务类型的发现规则,在规则配置时被选中,在资产发现时可根据自定义的数据字典进行发现;此外系统通过自动字典推荐发现的字典也可在该模块进行维护和调整。

③ 业务类型管理:系统按照行业特性内置了大量的字段业务类型对应的标准和发现规则。支持用户新增字段业务类型并配置发现规则,包括列内容匹配、字段名匹配和列注释匹配,同时支持对自定义规则的发现优先级和规则可信度的高级配置,确保识别结果输出的准确性。

④ 分类分级配置:用户在系统安装时可选择对应的行业,系统按照行业要求内置了数据分类分级标准,用户可以在这条标准的基础上,按照企业实际情况调整分类和分级,包括层级、命名等。支持用户从业务类型管理中批量选择字段业务类型添加到数据分类分级标准中,支持对字段业务类型的分类分级进行调整。

6、接口配置

暗数据发现和分类系统通过标准化的接口提供数据资产发现和分类分级的能力和结果。三方应用可按照接口对接流程及详细接口说明文档完成和暗数据发现的对接。

产品优势


1、准确定位数据存储位置:自动探查数据存储位置,发现数据库数量、IP、端口、类型等信息。

2、资产发现适配多种数据源:适配多种数据源,包括关系型数据库、大数据平台、云数据库等,通过广泛的适配各种各样的数据源扫描相关数据,充分利用数据库内的数据信息进行统计分析,从而可以得到全面的关于数据分布、规模、种类的分析结果。

3、内置发现模版,适配多个行业:美创历经10年深入行业的研究,通过对多个行业的分类分级标准的解读、整理,内置为系统的数据分类分级发现模版,能够实现对多个行业的自动分类分级梳理,包括医疗、金融、政府、工业等行业。

4、内置丰富数据标准和发现规则:内置完善和健壮的数据字典、标准和规则,通过数据特征分析和NLP(自然语义识别)技术识别数据含义,同时还可以根据数据特征自动提取规则,实现规则的快速补充,确保识别覆盖率。

5、发现结果可视化:提供丰富图表,通过可视化的方式展示数据发现和分类分级报告,同时支持用户对图表进行点击查看、缩放、拖拽并进行修改等操作,在帮助用户迅速了解大量数据的同时增加了交互性。

6、提供接口和产品对接能力:提供标准对外接口方案,能与其他系统进行交互,将数据发现和分类分级的能力和结果提供给三方系统,能在数据安全治理、数据分级分类、数据资产管理等方面进行协作,更大的发挥数据的利用价值。

7、业内首批通过中国信通院数据分类分级专业工具测评:美创在三年前已经开始研究数据分类分级的相关方案及产品研发,并首批通过 “数据分类分级工具”权威评测,从数据源管理能力、规则管理能力、数据分类分级能力和系统管理能力,满足从数据源发现到分类分级结果应用的全流程技术要求。

服务客户/使用人数



在金融行业:美创暗数据发现与分类分级平台为中国人民银行乌鲁木齐中心支行、浙江农村商业联合银行、东阳农村商业银行等用户实现业务系统的梳理和识别、发现敏感字段,建立分类分级标准。

在垂直政府部门:美创暗数据发现与分类分级平台为杭州市人力资源社会保障局、衢州市卫健委、柯城医保局、淳安数据资源管理中心等进行分类分级建设,更好的盘活海量政务数据,支撑政府决策和便民服务、满足安全合规需求。

在企业行业:美创暗数据发现与分类分级平台已在中国邮政、上海燃气等企业实现自动化分类分级,为数据安全治理、数据安全建设精准化防护夯实基础。

市场价值


数据分类分级是数据精细化防护以及数据价值提升的基础性工程,
近年来,关于数据分类分级相关的法律法规及国家、各地方、各行业标准陆续出台。目前,业界大多数数据分类分级系统实现思路是“先梳理现有数据,再结合人工方式进行分类分级”,这一过程繁杂、效率低下、周期长,且主观性比较强,准确性差。美创科技暗数据发现与分类分级推出以来,已帮助医疗、卫健委、能源、金融等行业用户实现自动化的数据资产梳理与分类分级,并获得医疗、能源、电网等渠道商已进行批量采购。

可为用户带来以下价值:

1、缩短70%数据建设周期:在实际项目中,用户采用传统的数据治理、数据仓库建设可能需要3-6个月,通过暗数据发现和分类平台只要几周时间就能完成整个工作,暗数据发现和分类平台通过自动分析出表格中字段的含义以及表之间的关系,让员工在数据建设初期更快、更全地认识数据,从而达到缩短70%的数据建设周期的效果。

2、扩大企业数据资产10倍:相当少的企业会去分析数据库中的元数据,能对数据库中储存的表之间隐藏的关系、表存储的数据内容进行分析的企业就更少了。但是一旦进行分析,这一部分数据会生成丰富的分析结果,这与原本在业务系统一直展现的数据大不相同,而是将一直潜伏在冰面数据之下的暗数据展示出来,相当于直接扩大企业数据资产10倍。

3、降低50%数据利用成本:在建模和分析的场景中,员工需要对当前系统的数据做一个大致的了解,包括包含了哪些业务的数据、这些数据之间有没有一定关联以及数据具体含义等,然后在这个基础之上展开特定的工作。暗数据发现和分类平台可以帮助员工快速认识数据和数据之间的关联,有效节省时间,从而降低50%的数据利用成本。

提示:直接点击文末左下角“阅读原文”链接可直达该产品官网页面。

产品所属企业·:美创科技

杭州美创科技股份有限公司是国内领先的数据安全和数字化转型产品和服务提供商,目前拥有数据安全、数字化转型、运行安全三大业务及技术运维和安全运营服务,已为12000+行业用户提供产品、解决方案与服务,在全国32个省市设立分支机构。美创科技先后参与数十项国家行业标准制定,是国家网络与信息安全信息通报机制技术支持单位、CNCERT网络安全应急服务支撑单位、国家信息安全漏洞库(CNNVD)技术支撑单位、浙江省敏感数据企业研究院。



《2022中国企业数智化转型升级服务全景图/产业图谱2.0版》

《2022中国数据智能产业图谱2.0版》

 创新服务企业榜

 创新服务产品榜

 最具投资价值榜

 创新技术突破榜

条漫:《看过大佬们发的朋友圈之后,我相信:明天会更好!》

联系数据猿

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存