加入收藏 | 设为首页 | 会员中心 | 我要投稿 三门峡站长网 (https://www.0398zz.com.cn/)- 云连接、设备管理、智能边缘云、云防火墙、数据加密!
当前位置: 首页 > 大数据 > 正文

大数据中的偏见:如何发现它并减轻其作用

发布时间:2021-06-03 18:56:09 所属栏目:大数据 来源:互联网
导读:数据管道的不同部分都会产生偏见。人们非常关注在分析过程中可能出现的偏见,但其实偏见可能出现在数据管道的更早期阶段。 俄亥俄州立大学柯万种族研究所高级研究员Kelly Capatosto表示,偏见有可能早在收集数据前就进入数据生命周期。 A 她说:如果有人基于
数据管道的不同部分都会产生偏见。人们非常关注在分析过程中可能出现的偏见,但其实偏见可能出现在数据管道的更早期阶段。
俄亥俄州立大学柯万种族研究所高级研究员Kelly Capatosto表示,偏见有可能早在收集数据前就进入数据生命周期。
A
她说:“如果有人基于调查结果来确定程序、模型或算法的运行方式,那么设计师的先入为主的观念可能最终会融入到该过程中。”
现在对大型数据集及其所包含的偏见的审查越来越多。在目标市场营销等领域中故意偏见可能会有所优势,因为数据偏见可以提供更直接的见解,但大数据偏见会很快成为企业面临的问题。
下面是发现偏见和减轻其影响的方法:
在哪里找到它
Enterprise Strategy Group(ESG)的高级分析师Mike Leone说:“偏见出现在数据生命周期的早期。”
即使在数据收集过程中,也可能会无意中包含偏见。正如Capatosto所说,某些偏见可能会根深蒂固于用于收集数据的调查中,但是由于访问障碍,偏见也可能出现数据收集过程。最近的美国人口普查就是一个例子。
Capatosto说:“语言、贫困、获取技术等方面存在障碍,这使得很难将这种信息有意义地整合到任何给定过程中。”
另一件事是混杂。Capatosto说,算法偏差最突出的问题之一是将身份与一定程度的风险混为一谈。
Capatosto说:“在医疗保健方面,这非常重要,它具有联系人追踪功能,以及如何利用大数据和其他措施来建立围绕健康问题的公共设施和基础设施。”
她引用了最近的一项研究,该研究发现某些社区据称具有更普遍的医疗保健需求,但是满足这些需求的参数是花在医疗保健上的钱。其他研究发现,费用是有偏见的参数,因为有时费用本身首先是获取医疗保健的障碍。
虽然移除大数据中的恶意意图偏见很重要,但有时有必要包含偏见。
Gartner公司副总裁Svetlana Sicular说:“如果数据量很大,你可能只想知道某个特定人群。”

(编辑:三门峡站长网)

【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容!

    热点阅读