微软推人人可用的机器学习,打通windows应用程序任督二脉,惠及5000万开发者
即将开播:5月20日,基于kubernetes打造企业级私有云实践
北京时间 5 月 19 日晚间 11 点,微软一年一度的「Build开发者大会」正式线上开幕。
开篇微软CEO Satya Nadella 20分钟的演讲干货满满。开发者和合作伙伴最想知道的内容,他基本都在视频里都提到了。
演讲全程,Nadella 试图对开发者表现出一种慈父般的热情:「微软的使命是赋能每一个人,而且最主要的就是要赋能开发者,微软为你们打造的平台和工具是你们构筑这个智能时代的一砖一瓦。」
这种对开发者产生的浓厚兴趣,在2018年微软不惜大手笔收购开发者之家GitHub事件上,表现的淋漓尽致。
Nadella 称,拥有了GitHub后,微软就有机会为开发者构建最完整的工具链,汇集了GitHub、VisualStudio和Azure的精华。
目前GitHub的开发者数量超过了5000万。而两年前推出的低代码开发平台Power Platform的开发者数量也超过了350万人。
WhiteNoise:人人可用的差分隐私机器学习工具包
今年的大会,微软着重强调了机器学习领域的进展。
Build大会上微软宣布将开源多个机器学习工具包,这些工具跟以往的相比,更关注机器学习的隐私和公平性。
如今,各种底层架构的日趋成熟,开发人员构建一个人工智能模型变的越来越容易,但是有一个问题,这些系统是否「容易解释」 ,是否「遵守了非歧视和隐私规定」?
WhiteNoise
这次机器学习领域的重头戏要属WhiteNoise 了,WhiteNoise 是一个使用差分隐私的工具包,不久就可以通过 Azure 和 GitHub 上的开放源码来使用了。它加入了新的人工智能可解释性和公平性工具,以及新的数据、模型和访问控制,还新增了工作流溯源文档等。
差分隐私旨在提供一种加密方法,当从统计数据库查询时,最大化数据查询的准确性,同时最大限度减少识别其记录的机会。
WhiteNoise 工具包是微软与哈佛大学定量社会科学研究所合作开发的,它利用差分隐私来加密数据,可以保护数据中的个人信息,如姓名或出生日期等敏感信息。
WhiteNoise的算法会在原始数据中注入少量噪声,然后将其输入本地机器学习模型,从而使恶意攻击者难以从训练好的模型中逆向提取出原始文件。即使攻击者看到算法的输出,也不能判断它是否在计算中使用的特定个体的信息,WhiteNoise的算法就起到了隐私保护的作用。
比如医院想建立一个癌症治疗效果预测模型,首先你要保证预测的整个流程符合医院和其他监管部门的规定,同时你还要保证患者和医院的隐私信息不被泄漏,之前这个过程都要人工去审核,或者压根没有审核的机制。
现在通过WhiteNoise的私有算法库,通过简单的API就能实现整个流程的合规和数据隐私化处理。
除了WhiteNoise,微软还推出了两个旨在评估AI系统公平性和可解释性的工具包,Fairlearn 和InterpretML,将来这两个工具包也会融入到Azure的机器学习系统中。
Fairlearn
Fairlearn 则为开发人员和数据科学家提供了评估机器学习模型公平性和缓解不公平的能力。针对不同的人群,Fairlearn会在模型性能和公平性之间做一个取舍,争取到最佳平衡点。
Fairlearn 在一个仪表板上定义了 AI 系统是否对人不公平,模型主要关注两种危害: 分配危害和服务质量危害。当人工智能系统扩展或抑制机会、资源或信息(例如招聘、入学和借贷)时,分配危害就出现了。服务质量危害指的是,没有机会、资源或信息被延长或保留,但是系统区别对待两个人。
Fairlearn采用了一种被称为群体公平的方法,该方法旨在揭示哪些群体的个体面临着遭受伤害的风险。数据科学家指定工具包中的相关群体(例如性别、肤色和种族),然后通过一组正则项约束群体公平性,让不同群体之间具有可比性。
比如安永会计师事务所使用 Fairlearn 来评估男女贷款的不公平性。根据安永的调查数据,同样条件下,男性和女性获得贷款之间有15.3% 的差异。随后,安永利用 Fairlearn开发了多个补救模型,让性别差异减少到了0.43%。
InterpretML
最后出场的是InterpretML。这个工具包致力于帮助开发人员、数据科学家更全面地理解他们的机器学习模型。现在已经可以在Azure 机器学习中使用了。
想对比不同模型的效果,直接show!
InterpretML包含了许多机器学习的可解释性技术,通过可视化模型的行为和预测背后的推理来帮助解释模型。也就是说你用InterpretML不仅能选出对模型最重要的参数或变量,而且可以解释它们为什么是重要的。
有了上面这些工具包,开发人员就可以真正理解自己的模型``不光可以看到模型的可解释性和公平性,还能理解为什么模型做出这样那样的预测。
Project Reunion:做Windows应用开发从来没有这么容易
如果要问一个开发者,一个平台最让人抓狂的是什么?混乱,绝对是个把人逼疯的高手。
Windows应用开发的长期以来的混乱局面,微软自己都看不下去了,在Build大会上重磅推出了巨大更新:Project Reunion。
单从这个名字你就能感受到一股「We the Windows」「Make Windows great again」的味道扑面而来。
Project Reunion利用.NET包管理器NuGet等工具,统一访问现有的Win32和UWP API,并将其与操作系统解耦,为新的应用程序提供一个共同的平台,从而让你现有的应用能够紧跟平台步伐,而不在乎用的是C++、.NET、(包括WPF、Windows Forms和UWP)还是React Native。
Project Reunion包括两个组件:WinUI 3 Preview 1和WebView2的新预览版。
WinUI 3 Preview 1是微软最新的Windows UI框架,允许应用程序拥有一个可以跨设备扩展的、统一化、现代化的UI。
WebView2可以轻松地将基于Chromium的WebView嵌入到Windows Forms、WPF和UWP/WinUI 3应用程序中。WebView2与操作系统脱钩,成为又一条微软伸向其他平台的触手。
此外,微软升级了Windows子系统(WSL),加入了GPU加速和对GUI图形界面的支持,如此一来,不仅提升了在Linux下的并行计算、机器学习模型及训练,同时也允许WSL直接运行带有图形界面的Linux应用。
当然,少不了Windows Terminal 1.0。
Linuxer们可能始终没想到,最终来打通Windows和Linux之间壁垒的锤子,居然来自微软自己。
Azure量子计算平台预览版发布:开源量子开发工具包,人人可以从零学起
如果要问巨头们的下一个争夺的目标是什么?量子计算绝对在Top名单上。
未来几年,商用量子计算机投入市场时,对于相应开发人员的需求也会越来越高,企业需要提早开始准备。金融服务、汽车和制药行业等已经开始将量子计算的应用提上了日程。
去年年底,亚马逊就发布了量子计算服务Amazon Bracket预览版,并成立AWS量子计算中心和亚马逊量子解决方案实验室;今年三月份,谷歌开源了量子计算学习库TensorFlow Quantum。
因此在Build大会上,微软特意向开发者和公司客户展示了他们的「Azure量子计算平台预览版」。
Azure为开发人员提供了一个在线平台,来为量子计算机开发算法和应用程序,而不需要因为硬件和算法的更新而重写代码。
Azure量子计算部门也在和产业界合作,其中包括日本丰田通商公司想利用云量子计算服务来尝试解决路线规划和交通拥堵等问题。
Azure Quatum平台于去年11月份推出, 发布之初就震惊四座,这是继 IBM 和谷歌各自宣布实现量子优势/量子霸权后该领域的又一次重磅突破。
微软之所以现在就着急抛出预览版,意在抓紧时间挑选合作伙伴和开发者。为了争夺客户和开发者,微软开出了非常诱人的条件:一旦被选中,合作伙伴和开发者可以从微软、1QBit、霍尼韦尔、 IonQ 和 QCI 获得量子硬件和软件。
开发者是一个平台能否坚固的基石。为更好的吸引和培养量子计算领域的开发者,目前微软已开源了量子开发工具包(QDK),让任何人都可以从零开始学习量子计算。
此外,微软还在Microsoft Learn platform上推出了两门课程,教你用 Q# 语言写程序,以及通过量子计算来解决优化问题。