~J~
机器学习(Machine Learning)
先进的机器学习算法由许多技术(如深度学习、神经网络和自然语言处理)组成,用于无监督和有监督的学习,这些技术在现有信息的指导下运行。
~K~
可视化(Visualization)
可视化是显示信息对象及其关系的图示。战略可视化以图形方式通过显示上的对象的接近程度来说明关系的强度。先进的技术可以显著提高用户与大型知识库的接口能力。这些进步使用显示对象之间的距离来反映含义的相似性、内容的相似性或其他关系(例如,与组的关联)。
~R~
人工智能(Artificial Intelligence, AI)
人工智能应用先进的分析和基于逻辑的技术,包括机器学习,来解释事件,支持和自动化决策,并采取行动。
~S~
商业分析(Business Analytics)
商业分析包括用于构建分析模型和模拟以创建场景、了解现实和预测未来状态的解决方案。商业分析包括数据挖掘、预测分析、应用分析和统计,并作为适合业务用户的应用程序提供。这些分析解决方案通常附带针对行业业务流程(例如,索赔、承保或特定监管要求)的预构建行业内容。
商业智能(Business Intelligence, BI)
商务智能是一个总括性术语,包括应用程序、基础架构和工具,以及能够访问和分析信息以改进和优化决策和性能的最佳实践。
数据集成(Data Integration)
数据集成是将不同来源与格式的数据逻辑上或物理上进行集成的过程。传统上,数据集成可以分为两大类方法,即数据仓库和联邦数据库。数据库仓库技术在物理上将分布在多个数据源的数据统一集中到一个中央数据库中;而联邦数据库则仅通过将用户查询翻译为数据源查询来进行逻辑上的数据集成。
数据可视化(Data visualization)
数据可视化是指通过将数据或信息编码为图形中包含的可视对象(如点、线或条)来传递数据或信息的技术。其目标是向用户清晰有效地传达信息。它是数据分析或数据科学中的一个步骤。根据Friedman(2008年)的观点,“数据可视化的主要目标是通过图形方式清晰有效地传达信息。
数据伦理(Data Ethics)
数据伦理,是指系统化,捍卫和推荐与数据相关的正确与错误行为的概念,特别是个人数据。
自互联网诞生以来,数据的数量和质量都急剧增加,并且仍在以指数方式继续增长,大数据进一步描述了如此庞大和复杂的大量数据,传统的数据处理应用软件不足以处理它们。随着数据量的增加,其影响的规模也不断加大,数据伦理越来越重要。数据伦理则更关注结构化或非结构化数据的收集者和传播者。例如数据经纪人,政府和大公司。
数据伦理涉及以下原则:1. 所有权 – 个人拥有自己的数据。2. 交易透明度 – 如果使用个人个人数据,他们应该可以透明地访问用于生成汇总数据集的算法设计.3。同意 – 如果个人或法人实体想要使用个人数据,则需要明确知情表示同意个人数据从数据所有者移动到谁,何时以及出于何种目的。4. 隐私 – 如果发生数据交易,则需要做出一切合理的努力来保护隐私。5. 货币 – 个人应了解因使用其个人数据和这些交易规模而产生的金融交易。6. 开放性 – 汇总数据集应该是免费提供的。
数据清洗(Data Cleaning)
数据清洗是从数据记录集、数据表或数据库中检测和纠正(或删除)损坏或不准确的记录的过程,指的是识别数据的不完整、不正确、不准确或不相关的部分,然后替换,修改,或删除脏数据或粗数据。数据清理可以与数据争用工具交互执行,也可以通过脚本进行批处理。
数据素养(Data Literacy)
数据读写能力是指在上下文中读、写和交流数据的能力,包括对数据源和结构的理解、应用的分析方法和技术,以及描述用例应用和结果价值的能力。
数据挖掘(Data Mining)
通过筛选存储在存储库中的大量数据来发现有意义的相关性、模式和趋势的过程。数据挖掘采用了模式识别技术,以及统计和数学技术。
数据治理(Data Governance)
数据治理是决策权的规范和问责制框架,以确保数据和分析的评估、创建、使用和控制中的适当行为。