加入收藏 | 设为首页 | 会员中心 | 我要投稿 济南站长网 (https://www.0531zz.com/)- 科技、建站、经验、云计算、5G、大数据,站长网!
当前位置: 首页 > 大数据 > 正文

数据映射优秀实践 类型 办法和工具的简要指南

发布时间:2022-05-24 14:34:20 所属栏目:大数据 来源:互联网
导读:在任何应用程序集成、数据迁移以及一般的数据管理计划中,数据映射都是最关键的步骤之一。甚至可以这么认为:集成项目的成功在很大程度上取决于源数据到目标数据的正确映射。 本文将探讨有关数据映射的优秀实践,包括类型、常用方法以及一些有用的数据映射
          在任何应用程序集成、数据迁移以及一般的数据管理计划中,数据映射都是最关键的步骤之一。甚至可以这么认为:集成项目的成功在很大程度上取决于源数据到目标数据的正确映射。
 
          本文将探讨有关数据映射的优秀实践,包括类型、常用方法以及一些有用的数据映射工具。
 
一、开门见山:数据映射意味着什么?
          本质上,数据映射是将数据字段从源系统(业务应用程序或数据库)连接到目标系统的过程。
 
          许多应用程序在前端共享相同的公共字段命名模式,但在后台,这些相同的字段可以有完全不同的标签。拿“顾客”字段举例:在公司CRM系统的源代码中,它可能仍然有“顾客”的标签,但是你的ERP系统称它为“客户”,你的财务工具称它为“顾客”,而你的组织用于客户讯息的工具将完全映射它的“用户”。这样的标签难题可能正是最常见的一种数据映射示例。
 
二、数据映射的类型有哪些?
尤其是在涉及复杂项目时,有两种类型的数据映射需要考虑:
 
逻辑数据映射是项目的一个更高层次的概念阶段。
物理数据映射是一个面向实现的阶段,而不是实际操作阶段。
逻辑数据映射可以看作是数据建模的第一步。它可以是概念模型的一部分,在概念模型中,我们识别现实生活中的对象,并将其与组织相关的概念相匹配,例如,将产品信息、产品订单历史记录和产品可用性分组为单个概念“产品”。
 
三、三种常见的数据映射方法
正如上文所示,数据映射多少需要一些技术理解,具体取决于数据映射方法。大体来说,有三种方法可供选择:
 
手动
半自动化
全自动
每种方法都有其优缺点。
 
1.手动数据映射
手动数据映射本身就是一门学问。因为它不仅需要很好地理解转换规则和编程语言,还需要足够的人力和时间资源来创建地图、记录步骤,并随着连接的软件系统数量的增加而执行后续的更新和更改。
 
优点:通过这种方法,您可以百分之百地确定实施过程完全符合业务需求。此外,也不需要依赖任何第三方工具。
 
缺点:它非常耗时,代码非常繁重,而且容易出错。假如专门数据映射人员从团队离职,那么他们的继任者可能很难理解映射完成的过程。
 
2.半自动数据映射
有时也称为模式映射,在这种方法中,您可以使用一个软件工具,在无需开发人员参与的情况下,将类似的数据模式链接在一起。为此,该工具将比较源系统和目标系统的模式,并生成一个关系图,随后,开发者将审查这个关系图,并做出必要修改。与手动数据映射方法类似,半自动映射工具可以用相关的编码语言生成输出代码。
 
优点:这种方法仍然为开发人员提供了很大的灵活性,但与手动数据映射方法相比,这种方法的耗时不见得少很多。
 
缺点:它同样要求人员有相当高水平的编码技能,同时手动和自动操作之间的切换仍然是资源密集型的。
 
3.全自动数据映射
全自动数据映射可能是最主流的方法,这意味着有一整套产品和工具可以促进数据集成的自动化低代码/无代码方法,从而实现数据映射。这类工具具有拖放或点击选择的图形界面,这种图形界面易于理解使用,不仅适用于经验丰富的程序员和IT架构师,也适用于初级开发人员甚至业务线用户,使数据映射过程对所有人都不再有门槛。一些现代工具甚至具有自然语言处理 (NLP) 功能,可以完全自动匹配数据字段。
 
优点:全自动数据映射为开发人员节省了大量时间,且因为需要的高深技术知识较少,它可供范围更广的IT员工使用;全自动数据映射易于扩展,并为数据集成项目提供了许多有用的功能(安排日程、各种部署、预构建模板等)。
 
缺点:它是一个组织将依赖的第三方工具,入门通常至少需要一定程度的培训,且成本可能会迅速增加,具体取决于各个供应商的定价模式。

(编辑:济南站长网)

【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容!