当前位置:主页 > 混合云 > 正文

服务器排名_购买_在线云存储

时间:2021-04-07 22:30 来源:埃里克云 编辑:埃里克云

核心提示

供稿作者:张珍妮,比拉尔·马哈茂德,辛迪·罗杰斯机器学习是一种工具。一个强大的工具,但由人类构建,因此是我们使用它的偏见、数据和上下文的产物。这一工具可能导致重大...

服务器排名_购买_在线云存储

供稿作者:张珍妮,比拉尔·马哈茂德,辛迪·罗杰斯机器学习是一种工具。一个强大的工具,但由人类构建,因此是我们使用它的偏见、数据和上下文的产物。这一工具可能导致重大的伦理挑战和不公正,例如犯罪预测系统说,黑人被告会给累犯带来更高的风险,或者预测广告系统显示男性比女性拥有高收入工作。这个问题也延伸到产品分析。成千上万的团队利用数据做出影响全球数十亿用户的产品决策。他们预测结果,比如谁将购买或他们将查看什么内容,因此他们有权为每个用户个性化定价和内容。如果现在不注意这一点,公司可能会无意中发布对受保护群体有偏见的个性化体验,比如价格折扣偏向某个种族,或者应用程序推荐因性别而异。我们有道德责任确保这些个性化体验具有最小的内在偏见。因此,今天在振幅,我们承诺投资于改善机器学习基础设施的公平性,该基础设施为振幅的产品智能平台提供动力。我们知道这里没有银弹。这将是一项持续而艰难的努力。但我们希望将我们的承诺公之于众,以便我们的客户知道,他们从振幅中得出的预测性见解将有更高的公平性保证。反过来,我们希望我们的客户和ML社区都能深入了解如何在分析上下文中处理这个问题。什么是公平?什么是"公平"的机器学习模式?在描述我们将要投资的公平解决方案之前,诊断问题是如何发生的很重要。下面,我们将概述振幅投资的两类对分析感兴趣的领域:预测公平和社会公平。预测公平性预测公平性是指在受保护属性(例如种族、性别、年龄等)的不同群体之间进行类似的统计分析。衡量绩效的标准可能不同,但在分析的背景下,我们关注两个方面:机会均等和机会均等。概率相等是指预测分析在一个受保护的属性中,每个组的真阳性(敏感性)和真阴性(特异性)的比率相等。描述性地,敏感性测量预测为阳性的实际阳性数据点的比例,特异性测量预测为阴性的实际阴性数据点的比例。如果我们能正确地预测出这两种情况下的平均概率,那么这两种情况下的概率是相等的。以电子商务中的一个常见用例为例:预测生存期价值(LTV)。假设LTV只有两个值-高和低。如果用高贷款价值比正确预测的高消费者比例,或用低贷款价值比正确预测的低消费者比例,一个性别比另一个性别更大,则不满足机会均等。如果不加以纠正,可能会导致下游定价歧视。例如,在不满足赔率相等的情况下,提供与用户预测的贷款价值比成比例的折扣可能导致两个不同性别的用户获得不同的折扣,即使他们的消费率是相同的。机会均等是预测公平的一个更宽松的衡量标准。当一个预测分析在一个受保护的属性中每一组的假阴性率相等时。就上下文而言,假阴性是实际阳性数据点中预测为阴性的比例。通俗地说,这意味着,如果我们只是正确地预测积极的案例,在整个受保护类别中,机会均等是可以得到满足的。回到我们的电子商务例子:如果被错误地预测为拥有低贷款价值比的高消费人群的比例比另一性别高,那么机会平等就不能得到满足。但是相反的情况——低消费用户的不平等预测率——不会违反机会均等,因为它只关心积极阶层。使用哪种衡量标准的问题——只有正面案例重要的机会均等,而正面和负面案例都重要的机会均等——将取决于应用。在上面的例子中,如果高消费和低消费的用户都可以获得折扣,那么赔率相等更为谨慎。但是,如果只有高消费用户才能获得折扣,那么只有积极的案例才是重要的,机会均等可能就足够了。社会公平如果说预测公平关注的是一个分析的算法,那么社会公平就是关于底层数据的。即使一个算法在预测上是公平的,它也可能产生结果,使我们社会中存在的不平等制度永久化,并在我们用来训练预测算法或分析的历史数据中得到体现。衡量社会公平的一个常见的衡量标准是人口均等。这意味着受保护属性中的每个组都有相同的概率从预测中获得积极结果。通俗地说,这意味着,如果积极结果的比率代表人口中的人口比例,人口均等就满足了。例如,如果18%的高消费人群是同一性别的人,那么如果预测有高LTV的18%的用户是该性别的人,那么人口均等就可以满足了。反过来,这将确保向每个性别提供的折扣百分比与其在人口中的代表性成比例。请注意,确保人口均等并不一定确保预测公平,反之亦然。以这项基于历史毕业率预测大学录取率的研究为例。由于基础数据本身表明,白人学生的毕业率高于黑人学生,因此一个可预测的公平算法将使白人学生比黑人学生获得更高的入学预测分数。当然,这似乎不公平。由于社会背景和历史压迫系统不容易被表示为数据输入,一个满足机会和机会均等的预测公平算法仍然可能缺乏社会公平性。提高公平性那么,如何确保分析中的预测公平和社会公平呢?考虑到在确保平等与平等之间的权衡,这些问题的解决方案可能很棘手。下面我们将详细介绍几种方法-特征盲法、目标函数修正法、对抗性分类法和阈值法。在以后的文章中,我们计划详细介绍我们在振幅上使用的确切方法。特征盲法消除对某些人口统计数据的偏见的最简单方法是简单地删除作为预测分析输入的受保护属性(例如种族、性别等)。因此,这些属性将不再直接使模型偏向特定的方向。这在理论上似乎不错,但往往是不够的。即使我们删除了受保护的属性,与之相关的其他属性也可能保留下来。例如,浏览器或设备类型可能与race密切相关。因此,我们建立的预测模型仍然可以通过设备类型与种族的间接关系来学习种族偏见。我们可以尝试删除这些相关的属性,但我们可能会丢失太多的重要信号,使我们的模型失去任何效用。同样具有讽刺意味的是,通过对受保护属性的盲目性,我们无法纠正它们与相关属性的关系。"我看不到种族"这句话在数据上和在社会环境中一样有问题。目标函数修正在不影响算法性能的前提下,人们已经对满足预测公平性的解决方案进行了大量的研究。一个这样的优化是改变我们的预测模型优化的目标函数。大多数预测分析都是围绕着最大化目标函数进行优化的,目标函数是为结果的准确性而调整的。为了减少偏差,我们可以在目标函数中添加不同的度量。我们可以通过同时优化指标的期望值(如人口统计学组之间的总体均等性或独立于人口统计学变量)来优化概率和/或机会均等的分析。但分析的准确度往往会略有下降,但影响不大。事实上,这种分析有时可能会补偿虚假的相关性,比如竞争到设备类型。对抗性分类对抗性分类是一种既能解决准确性问题又能尊重受保护属性的技术。在这种情况下,我们创建同步预测模型-一个优化以正确预测我们期望的结果,另一个优化用于预测我们的受保护属性-本质上,并不比随机猜测好。让我们以预测贷款价值比为例。通过对抗性选择优化的模型将优化以最大限度地提高预测用户LTV的准确性,但优化的目标是最小化预测该用户种族的准确性。其结果可能是一种分析,在不过度牺牲质量的情况下为用户产生更公平的结果。后处理优化后处理优化是一种更专门针对人口均等性进行校正的技术。这包括在预测性分析完成后修改其输出,确保预测阳性病例同样代表受保护组。例如,在我们预测的LTV示例中,假设我们希望向1000个用户中排名前10%的用户发送折扣。然而,尽管1000个用户中有200个是黑人用户,但在前10%的预测中没有黑人用户,因此不会收到di

  • cdn服务商_关于_云计算平台试用 cdn服务商_关于_云计算平台试用

    本周,我们将推出基于活动的分析,这是通过与我们的客户密切合作创建的。你可以很容易地每天浏览一份任务清单——通过外联,你知道该给谁发邮件和打电话给谁。但是你怎么知...

  • 好用的云存储_如何选_云计算平台 好用的云存储_如何选_云计算平台

    我们很高兴与大家分享外展的新面貌!新外展部采用了漂亮、现代的设计,重点在于为销售代表提供所需的洞察力和能力,使他们能够在工作地点工作。在过去的3年里,与客户的合作...

  • 宽带速度_购买_云服务器网 宽带速度_购买_云服务器网

    从投资者到潜在客户,我经常被问到的一个问题是,"自动化不是在使销售过程失去人性吗?你不是在用没人情味的机器人来代替销售人员吗?"尽管外展是一个销售参与平台,毋庸置疑...

  • 关系数据库_便宜的_云计算云计算 关系数据库_便宜的_云计算云计算

    顶尖的销售代表知道,在最初的几秒钟内吸引潜在客户的注意力可以决定会议的成败。私人和有意义的谈话会带来更多的交易,赢得更多的生意,并与客户建立更牢固的关系。然而,...

  • 服务器采购_怎么购买_租云服务器 服务器采购_怎么购买_租云服务器

    关于如何最好地接近潜在客户有很多种观点:你应该登陆并扩张吗?你是不是应该冲出大门直接去高级套房?当针对销售周期较长的全国性公司时,我们的销售团队倾向于同时使用这...

  • 阿里云香港服务器_如何使用_如何在云服 阿里云香港服务器_如何使用_如何在云服

    两年后,143个功能发布,2000个客户,16000个活跃用户,我们终于做到了:我们举行了我们的首次客户会议,释放!有太多的想法要分享,产品特性要宣布,葡萄酒也要喝。我们很幸运...

  • 海量数据存储_虚拟_如何使用云计算 海量数据存储_虚拟_如何使用云计算

    我们与各种各样的客户合作,有些客户在他们的市场上比较成熟,有些客户刚刚起步。较新的公司可能没有集中的CRM,而是可能使用电子表格或更小的CRM数据库。虽然我们有强大的S...

  • sql server数据库_虚拟_网站服务器主机 sql server数据库_虚拟_网站服务器主机

    昨天结束了释放。索诺玛,你对我们很好。#STL今天出发了。pic.twitter.com/QiKOoYq5Od-emily muhoberac(@muhobs)2017年6月7日外展部的首次客户会议"释放"已经过去一周了,我们的整个办公室仍然...

  • 云存储_表较好的_国内低价云服务器 云存储_表较好的_国内低价云服务器

    虽然让你的销售代表能够始终如一地达到他们的配额并不是什么大秘密,但是快速的谷歌搜索会返回成百上千的销售配额实现理论。我有一个策略,多年来我一直在推动配额的实现,...