如何用 Python 选出好用又便宜的手机？

Stephenzsky

2018-10-11

如何用 Python 选出好用又便宜的手机？

如何用 Python 选出好用又便宜的手机？

9月13日发布的iPhone Xs算是手机界的大新闻了，新款iPhone的价格也再度刷新了手机定价的记录。看完发布会，相信很多人的心情是这样的......

如何用 Python 选出好用又便宜的手机？

笔者之前用的iPhone 6，最近准备换手机。经济形势严峻，换iPhone是换不起了，只能消费降级，投奔安卓阵营。

1500元的预算，连个二手的iPhone都买不了，但是在安卓机里却有不少选择。本文我们就来看看怎样用数据分析选购手机。

如何用 Python 选出好用又便宜的手机？

分析思路

思路很简单，上京东商城把所有手机的数据爬下来，然后根据配置、价格过滤出符合条件的手机，在过滤出来的手机里选择一部性价比最高的。画成流程图，大致是这样的：

如何用 Python 选出好用又便宜的手机？

如何用 Python 选出好用又便宜的手机？

爬取数据

第一步，我们先从京东商城爬取所有在售的手机数据。这里我们关心的主要是价格和配置信息，商品页面上的价格和配置信息像下面两张图所示：

如何用 Python 选出好用又便宜的手机？

如何用 Python 选出好用又便宜的手机？

我们编写代码爬取所有手机的价格和配置信息，爬虫的核心代码如下：

# 获取手机单品的价格
def get_price(skuid):
 url = "https://c0.3.cn/stock?skuId=" + str(skuid) + "&amp;area=1_72_4137_0&amp;venderId=1000004123&amp;cat=9987,653,655&amp;buyNum=1&amp;choseSuitSkuIds=&amp;extraParam={%22originid%22:%221%22}&amp;ch=1&amp;fqsp=0&amp;pduid=15379228074621272760279&amp;pdpin=&amp;detailedAdd=null&amp;callback=jQuery3285040"
 r = requests.get(url, verify=False)
 content = r.content.decode('GBK')
 matched = re.search(r'jQueryd+((.*))', content, re.M)
 if matched:
 data = json.loads(matched.group(1))
 price = float(data["stock"]["jdPrice"]["p"])
 return price
 return 0
# 获取手机的配置信息
def get_item(skuid, url):
 price = get_price(skuid)
 r = requests.get(url, verify=False)
 content = r.content
 root = etree.HTML(content)
 nodes = root.xpath('.//div[@class="Ptable"]/div[@class="Ptable-item"]')
 params = {"price": price, "skuid": skuid}
 for node in nodes:
 text_nodes = node.xpath('./dl')[0]
 k = ""
 v = ""
 for text_node in text_nodes:
 if text_node.tag == "dt":
 k = text_node.text
 elif text_node.tag == "dd" and "class" not in text_node.attrib:
 v = text_node.text
 params[k] = v
 return params
# 获取一个页面中的所有手机信息
def get_cellphone(page):
 url = "https://list.jd.com/list.html?cat=9987,653,655&amp;page={}&amp;sort=sort_rank_asc&amp;trans=1&amp;JL=6_0_0&amp;ms=4#J_main".format(page)
 r = requests.get(url, verify=False)
 content = r.content.decode("utf-8")
 root = etree.HTML(content)
 cell_nodes = root.xpath('.//div[@class="p-img"]/a')
 client = pymongo.MongoClient()
 db = client[DB]
 for node in cell_nodes:
 item_url = fix_url(node.attrib["href"])
 matched = re.search('item.jd.com/(d+).html', item_url)
 skuid = int(matched.group(1))
 saved = db.items.find({"skuid": skuid}).count()
 if saved &gt; 0:
 print(saved)
 continue
 item = get_item(skuid, item_url)
 # 结果存入MongoDB
 db.items.insert(item)

需要注意的是，上面的get_price和get_item函数分别从两个url获取数据，这是因为配置信息可以直接从商品页面中解析得到，而价格信息需要从另外一个ajax请求里获得。爬下来的所有数据存入MongoDB。

如何用 Python 选出好用又便宜的手机？

过滤数据

爬下来的手机数据当中，信息完整的共有4700多条数据，这4700多部手机属于70个手机品牌。这些品牌画成词云图是这样的：

如何用 Python 选出好用又便宜的手机？

手机的配置主要有以下这些参数：

是否双卡双待；
机身材质；
CPU型号；
内存大小；
存储容量；
电池容量；
屏幕材质；
屏幕大小；
分辨率；
摄像头。

强哥平时用手机主要是看看书、刷刷知乎微信、买买东西，所以选购新手机的时候最关心的就是速度、容量、待机时间这几项，对摄像头、屏幕材质倒不是特别在乎。考虑以上因素，在对数据做过滤的时候，我设定了以下几个条件：

CPU的品牌是高通；
内存大小大于等于6GB；
存储容量大于等于64GB；
电池容量大于3000mAh；
必须是双卡双待；
价格在1500元以内。

过滤数据的代码如下：

client = pymongo.MongoClient()
db = client[DB]
items = db.items.find({})
result = preprocess(items)
df = pd.DataFrame(result)
df_res = df[df.cpu_brand=="骁龙（Snapdragon)"][df.battery_cap &gt;= 3000][df.rom &gt;= 64][df.ram &gt;= 6][df.dual_sim == True][df.price&lt;=1500]
print(df_res[["brand", "model", "color", "cpu_brand", "cpu_freq", "cpu_core", "cpu_model", "rom", "ram", "battery_cap", "price"]].sort_values(by="price"))

首先从MongoDB里读取数据，然后创建DataFrame，对DataFrame里的数据按照上面的条件作选择。代码的最后一行将筛选出来的手机打印出来，并按价格从低到高排序。

经过了这样一轮筛选后，我们得到了下面的38款手机：

如何用 Python 选出好用又便宜的手机？

上面的几部手机配置都比较接近，但是网上对小米的评价普遍比较高，于是又在上面的列表里筛选出了所有的小米手机，得到下面7款：

如何用 Python 选出好用又便宜的手机？

这里就变成了红米Note5和小米6X的PK了。价格上，两者不差上下。配置方面，网上查到红米Note5的cpu是骁龙636的（上面的表格里缺少红米Note5的cpu型号），相比小米6X的骁龙660，636虽然性能上不如660，但更省电，而且考虑到红米Note5 4000毫安的超大容量电池，最后决定了购买红米Note 5这一款。作为一款千元机，骁龙636八核CPU、6G大内存、64G大存储、5.99英寸大视野全面屏、前置相机+后置双摄、超长的待机时间，这款手机大概算是千元机中的机皇了。

作者：强哥，资深Python程序员，先后供职于Morgan Stanley和ebay，擅长爬虫、Web开发、数据分析。

本文系作者投稿，不代表CSDN立场。

_“征稿啦_”

CSDN 公众号秉持着「与千万技术人共成长」理念，不仅以「极客头条」、「畅言」栏目在第一时间以技术人的独特视角描述技术人关心的行业焦点事件，更有「技术头条」专栏，深度解读行业内的热门技术与场景应用，让所有的开发者紧跟技术潮流，保持警醒的技术嗅觉，对行业趋势、技术有更为全面的认知。

如果你有优质的文章，或是行业热点事件、技术趋势的真知灼见，或是深度的应用实践、场景方案等的新见解，欢迎联系 CSDN 投稿，联系方式：微信（guorui_1118，请备注投稿+姓名+公司职位），邮箱（[email protected]）。

iphone 手机 python 编程语言数码

Stephenzsky

0 关注 0 粉丝 0 动态

相关推荐

iPhone与Mac手机连接，进行h5页面元素检查

四、在电脑端找到连接电脑的手机进入手机端打开的网页

marisafari 2020-05-27

解决苹果手机绑定小米手环4支付宝，蓝牙无法连接问题。

当你重启手机，或者重新绑定手环之后，还无法解决问题，还是在重复套娃操作，可以检查一下支付宝是否打开了蓝牙权限：设置==》支付宝==》蓝牙开启即可。

hushijiao 2020-05-17

js自动识别手机机型

if (u.indexOf(‘Android‘) > -1 || u.indexOf(‘Linux‘) > -1) {//安卓手机。alert("安卓手机");alert("苹果手机");} else i

csdnuuu 2020-05-07

iPhone SE2新爆料，或有大惊喜，小刘海+侧指纹，升级很大

iPhone SE2是一款让众多果粉期待的小屏旗舰手机，而关于真机的爆料消息也是越来越多，类似于iPhone 8一致的非全面屏设计，还有5G的缺失让很多的消费者对于这款旗舰丧失了兴趣！而如今伴随着手机圈子的各种爆料和消息，iPhone SE2或有大的扭转，

xiaoxiaodedu 2020-01-05

iPhone SE2或有新名字，苹果A13+经典设计ID，库克打起了亲情牌

苹果在整个手机市场都是很受瞩目的，而今年可以说是苹果最难熬的一年吧！随着5G的发展，除了苹果其他的手机厂商都会陆陆续续得发布属于自己的双模5G机型，这几乎是消费者今年购机的凭证，而5G版本的iPhone最快也要到9月份！华米OV，一加魅族都将发布5G旗舰。

中国软件网 2020-01-05

iPhone 12将带来多项黑科技，四摄+双模5G+真全面屏，价格良心

iPhone 11在国内外取得了很不错的市场销量，浴霸的摄像头得到了大部分消费者的认可，还有极致的硬件性能表现，这些都是取得市场销量好成绩的重要原因，但还是有很多消费者犹豫了，因为明年的新款iPhone会更给力。明年发布的iPhone 12已经有了很多的爆

xiaoxiaodedu 2019-12-26

华为Mate30系列5G版热销，苹果用户流失速度加速

近些年来，苹果iPhone的创新一代不如一代，iOS系统似乎已经成为其唯一的“护城河”。而据外媒报道，美国投资银行马克西姆集团指出苹果正在面临iPhone产品保留率下降的问题。数据显示，从安装用户群来看，流失率从5%上升到了9%。马克西姆集团的分析师Ne

qual0 2019-12-25

iOS/iPad OS 14公测Beta 4发布：修复3D Touch问题

苹果今天发布了 iOS 14 和 iPadOS 14 的最新公测 Beta，今天的新 Beta 被苹果标记为 Beta 4，这使得公测版和开发者测试版的版本号一致，但实际上这是苹果发布的第 3 个公测 Beta。距离之前发布的Beta版本已经过去了两周的

Mryiyi 2020-08-07

报告：苹果 iOS 14 将支持所有运行 iOS 13 的 iPhone 与 iPod touch

今日，据外媒macrumors援引以色列网站The Verifier共享的信息，iOS 14将支持所有能够运行iOS 13的iPhone和iPod touch。据介绍，兼容性数据是在泄漏的iOS 14版本中找到的，并由The Verifier证实是“来自

suweierxing 2020-06-02

苹果降低App Store抽成，开发者们能赚更多钱了？

“你在我的地盘上摆摊，我向你收租。”App Store 的佣金抽成策略对于苹果来说早已不是什么秘密。简单来说，就是你的产品在 App Store 如果卖出了 100 块，你能拿到的部分是 70 块，而苹果要抽走 30 块作为佣金，这 30% 的佣金比例如今

liuxudong00 2020-11-19

苹果正秘密开发自家搜索功能谷歌地位会被取代吗？

最新版的iPhone操作系统iOS 14出现了一个不太显眼的变化，苹果开始显示自己的搜索结果，并在用户从主屏幕键入信息查询时直接链接到网站。多位业内人士表示，这种网络搜索功能的出现标志着苹果内部开发的一个重要进展，可能会对谷歌搜索发起更全面的竞争奠定基础。

章鱼之家 2020-10-29

苹果发布iOS 14.1和iPadOS 14.1 带来了多项Bug修复

苹果今天发布了iOS和iPadOS 14.1，这是9月份发布的iOS和iPadOS 14操作系统更新的第一个重大更新，iOS和iPadOS 14.1是在苹果向开发者发布GM版本更新一周后发布的。iOS 14.1更新可以免费下载，所有符合条件的设备都可以在

leitingdulante 2020-10-21

iPhone装了App却在桌面找不到？教你如何解决

最近，有朋友向笔者反馈一个非常蛋疼的问题——iPhone安装了App后，却没法在桌面找到它!这种情况在之前是没有的，为什么现在会出现?这其实和iOS14的一个新特性“App资源库”有关。在以往的iOS系统中，App都是全部排布在主屏幕中的，下载了App，自

xuegangic 2020-10-17

iOS 14.2 再次更新：iPhone 12新功能提前出现

昨天，苹果发布了 iOS 14.1 GM版和 iOS 14.2 beta 3 更新。由于有两个测试版，因此 iPhone 只能检测到 iOS 14.2 这一个高版本，想更新 iOS 14.1 GM 只能用电脑刷机。iPhone 12 新功能提前出现：iOS

硬币0 2020-10-15

苹果iOS 14.2更新啦！推出全新曲目识别功能

9月18日讯，正如此前预料的一般，在昨天推送iOS 14正式版过后，苹果在今天凌晨正式发布了iOS/iPadOS 14.2 Beta 1开发者预览版，正式开启新一轮的iOS/iPadOS系统测试。根据外媒MacRumor报道，苹果在iOS 14.2 Be

ZuoYanDeHuangHun 2020-09-18

关于iOS/iPadOS 14 值不值得升级看这一篇就够了

经过了三个月的测试，iOS/iPadOS 14 正式版终于在 9 月 17 日到来，以下兼容的设备均可更新至最新的 iOS / iPadOS 14，由于是大版本更新，所以建议在更新前先对数据进行备份。iPhone：iPhone 11 系列 / iPhon

chsoft 2020-09-17

苹果关闭iOS 13.6验证不允许用户降级

今天，苹果再次对iOS 13系统做出了调整，如果你还想降级，那么就要慎重了。停止签名意味着用户无法再从苹果的服务器上下载过时的操作系统，习惯上苹果在发布iOS新版本后会定期停止签署旧代码，以防止用户安装过去的iOS版本。这种做法可以让用户免受新威胁的影响，

MatrixHero 2020-08-20

苹果发布 watchOS 7 首个公测版升级前务必注意这些事项

苹果公司今天正式发布 watchOS 7 的首个公开测试版。这也是 watchOS 这个系统历史上首次面向所有用户发出公测版本。如果想体验尝试，可以用与手表配对的 iPhone 打开 beta.apple.com 注册设备，手机接受到公测版描述文件后，便会

XxZproject 2020-08-10

苹果发布iOS 13重大更新：iPhone终于不绿了！

今天上午，苹果正式发布iOS 13.6.1/iPadOS 13.6.1版本。不出意外的话，本次版本更新将会是iOS 13系统的最后一次更新了，目前苹果的重心全部放在即将到来的iOS 14系统上，它的正式版预计会在9月中旬发布。此前参与了iOS系统测试，正在

定格 2020-08-15

苹果承认安卓地位库克：谷歌拥有占据全球主导地位的操作系统

到底谁才是全球手机系统第一，或许让竞争对手说出来才更有趣。苹果公司CEO蒂姆·库克在周三向美国国会众议院司法委员会作证时表示，苹果公司不是个垄断企业。而iPhone在智能手机中也不占主导地位，事实上，谷歌拥有占据全球主导地位的操作系统，也就是Android

ydc0 2020-07-30

Stephenzsky

W3CSchool教程: HTML 教程; CSS 教程; Bootstrap 教程; Javascript 教程; jQuery 教程

后端教程: C 教程; Java 教程; PHP 教程; Python 教程; Go 教程

移动开发: Android 教程; Swift 教程; Kotlin 教程; jQuery Mobile 教程; ionic 教程

关于我们: 新闻动态; 联系方式; 招聘英才; 安科实验室; 帮助与反馈

安科网(Ancii)，中国第一极客网

Copyright © 2013 - 2019 Ancii.com

京ICP备18063983号京公网安备11010802014868号