UI2Code智能生成Flutter代码--整体设计篇

无风而起

2019-02-27

关注关注

闲鱼技术-上叶

背景:

随着移动互联网时代的到来，人类的科学技术突飞猛进。然而软件工程师们依旧需要花费大量精力在重复的还原UI视觉稿的工作。

UI视觉研发拥有明显的特征：组件，位置和布局，符合机器学习处理范畴。能否通过机器视觉和深度学习等手段自动生成UI界面代码，来解放重复劳动力，成为我们关注的方向。

UI2CODE简单介绍：

UI2CODE项目是闲鱼技术团队研发的一款通过机器视觉理解+AI人工智能将UI视觉图片转化为端侧代码的工具。

2018年3月UI2CODE开始启动技术可行性预研工作，到目前为止，经历了3次整体方案的重构（或者重写）。我们参考了大量的利用机器学习生成代码的方案，但都无法达到商用指标，UI2CODE的主要思想是将UI研发特征分而治之，避免鸡蛋放在一个篮子里。我们着重关注以下3个问题的解法：

视觉稿还原精度：我们的设计师甚至无法容忍1像素的位置偏差；
准确率：机器学习还处于概率学范畴，但我们需要100%的准确率；
易维护性：工程师们看的懂，改的动是起点，合理的布局结构才能保障界面流畅运行。

UI2CODE运行效果：

UI2CODE插件化运行效果，如下视频：进过几轮重构，最终我们定义UI2CODE主要解决feeds流的卡片自动生成，当然它也可以对页面级自动生成。

https://yunqivedio.alicdn.com/od/mm4Te1551157852340.mov

架构设计：

UI2Code智能生成Flutter代码--整体设计篇

简化分析下UI2CODE的流程：

UI2Code智能生成Flutter代码--整体设计篇

大体分为4个步骤:

1.通过机器视觉技术，从视觉稿提取GUI元素
2.通过深度学习技术，识别GUI元素类型
3.通过递归神经网络技术，生成DSL
4.通过语法树模板匹配，生成flutter代码

版面分析

版面分析只做一件事：切图。

图片切割效果直接决定UI2CODE输出结果的准确率。我们拿白色背景的简单UI来举例：

UI2Code智能生成Flutter代码--整体设计篇

上图是一个白色背景的UI，我们将图片读入内存，进行二值化处理：

def image_to_matrix(filename):
 im = Image.open(filename)
 width, height = im.size
 im = im.convert("L")
 matrix = np.asarray(im)
 return matrix, width, height

得到一个二维矩阵：将白色背景的值转化为0.

UI2Code智能生成Flutter代码--整体设计篇

像切西瓜一样，我们只需要5刀，就可以将GUI元素分离，切隔方法多种多样：（下面是横切的代码片段，实际切割逻辑稍微复杂些，基本是递归过程）

def cut_by_col(cut_num, _im_mask):
 zero_start = None
 zero_end = None
 end_range = len(_im_mask)
 for x in range(0, end_range):
 im = _im_mask[x]
 if len(np.where(im==0)[0]) == len(im):
 if zero_start == None:
 zero_start = x
 elif zero_start != None and zero_end == None:
 zero_end = x
 if zero_start != None and zero_end != None:
 start = zero_start
 if start &gt; 0:
 cut_num.append(start)
 zero_start = None
 zero_end = None
 if x == end_range-1 and zero_start != None and zero_end == None and zero_start &gt; 0:
 zero_end = x
 start = zero_start
 if start &gt; 0:
 cut_num.append(start)
 zero_start = None
 zero_end = None

客户端的UI基本都是纵向流式布局，我们可以先横切在纵切。

UI2Code智能生成Flutter代码--整体设计篇

将切割点的x，y轴坐标记录下来，它将是处理组件位置关系的核心。切割完成后，我们获取到2组数据：6个GUI元素图片和对应的坐标系记录。后续步骤通过分类神经网络进行组件识别。

在实际生产过程中，版面分析会复杂些，主要是在处理复杂背景方面。

UI2Code智能生成Flutter代码--整体设计篇

关注我们的技术公众号，我们后续会详细分解。

组件识别：

进行组件识别前我们需要收集一些组件样本进行训练，使用Tensorflow提供的CNN模型和SSD模型等进行增量训练。

UI2CODE对GUI进行了几十种类型分类：IMAGE， TEXT，SHAP/BUTTON，ICON，PRICE等等，分别归类为UI组件，CI组件和BI组件。

UI组件，主要针对flutter原生的组件进行分类。
CI组件，主要针对闲鱼自定义UIKIT进行分类。
BI组件，主要针对具备一定业务意义的feed卡片进行分类。

UI2Code智能生成Flutter代码--整体设计篇

组件的识别需要反复的通过全局特征反馈来纠正，通常会采用SSD+CNN协同工作，比如下图的红色“全新“shape，这该图例中是richtext的部分，同样的shape样式可能属于button或者icon。

UI2Code智能生成Flutter代码--整体设计篇

属性提取：

这块的技术点比较杂，归纳起来需要处理3部分内容：shape轮廓，字体属性和组件的宽高。

UI2Code智能生成Flutter代码--整体设计篇

完成属性提取，基本上我们完成所有GUI信息的提取。生成的GUI DSL如下图：

UI2Code智能生成Flutter代码--整体设计篇

通过这些数据我们就可以进行布局分析了。

其中文字属性的提取最为复杂，后续我们会专门介绍。

布局分析：

前期我们采用4层LSTM网络进行训练学习，由于样本量比较小，我们改为规则实现。规则实现也比较简单，我们在第一步切图时5刀切割的顺序就是row和col。缺点是布局比较死板，需要结合RNN进行前置反馈。

https://yunqivedio.alicdn.com/od/7DD7w1551157938106.mp4

视频中展示的是通过4层LSTM预测布局结构的效果，UI的布局结构就像房屋的框架，建造完成后通过GUI的属性进行精装修就完成了一个UI图层的代码还原工作。

代码生成及插件化：

机器学习本质上来说还属于概率学范畴，自动生成的代码需要非常高的还原度和100%的准确率，概率注定UI2CODE很难达到100%的准确率，所以我们需要提供一个可编辑工具，由开发者通过工具能够快速理解UI的布局结构和修改布局结构。

我们将UI2CODE生成的DSL TREE进行代码模板化匹配，代码模板的内容由资深的flutter技术专家来定义，它代表目前我们发现的最优代码实现方案。

UI2Code智能生成Flutter代码--整体设计篇

代码模板中会引入一些标签，由Intellij plugin来检索flutter工程中是否存在对应的自定义UIKIT，并进行替换，提高代码的复用度.

UI2Code智能生成Flutter代码--整体设计篇

整个插件化工程需要提供自定义UIKIT的检索，替换和校验工作，以及DSL Tree的创建，修改，图示等工作，总体来说，更像ERP系统，花费一些时间能够做的更加完美。

UI2Code智能生成Flutter代码--整体设计篇

小结：

本篇我们简单介绍了UI2CODE的设计思路，我们将整个工程结构分为5个部分，其中4块内容核心处理机器视觉的问题，通过机器学习将它们链接起来。代码的线上发布是非常严格的事情，而单纯的机器学习方式，很难达到我们要求，所以我们选择以机器视觉理解为主，机器学习为辅的方式，构建整个UI2CODE工程体系。我们将持续关注AI技术，来打造一个完美的UI2CODE工具。

机器学习 flutter

安科网

UI2Code智能生成Flutter代码--整体设计篇

无风而起

背景:

UI2CODE简单介绍：

UI2CODE运行效果：

版面分析

组件识别：

属性提取：

布局分析：

代码生成及插件化：

小结：

无风而起

相关推荐

TensorFlow为新旧Mac特供新版本，速度最高提升7倍

如何通过7个步骤构建机器学习模型

机器学习新风暴：如何用ML模型预测房价？

关于机器学习管道需要了解什么?

为什么所有的机器学习模型有90％从没有投入生产

LinkedIn开源Dagli，发布Java机器学习函数库

关于机器学习算法的16个技巧

全面解读谷歌云人工智能如何为机器学习提供帮助

关于感知器的故事：机器学习是如何发展到如今这一程度的呢？

需要知识的后深度学习时代，如何高效自动构建知识图谱

10个丰富自我的机器学习项目

机器学习如何颠覆金融行业

24个提高知识和技能极限的机器学习项目

IT自动化和人工智能将在2021年走向何方？

无监督机器学习的重要指南

机器学习概念和经典算法，我用大白话给你讲清楚了！入门必看

理解AI：为什么要在人工智能系统中寻求可解释性呢？

机器学习的未来就在这里：高斯过程和神经网络是等价的

Python 用5行代码学机器学习—线性回归

微软和谷歌分别开源分布式深度学习框架，各自厉害在哪？

无风而起