信息搜集之搜索引擎
1. 信息搜集的作用
信息零碎化,收集的工整性
1.1 为什么信息收集
- 获得信息
- 了解对方
- 掌握情况
- 寻找弱点
- 安全短板
1.2 收集哪些信息
网站的架构:osi模型 ------->域名,Whois,CDN,c段
前端:HTML/ CSS/ JS……------->各级指纹识别,GitHub /源代码泄漏,敏感文件和地址
后端:PHP /ASP.NET /容器 /数据库……------->框架识别,容器识别
中间件:中间件------->组件报错,解析漏洞
系统:windows /linux /mac ------>端口,系统识别
2. 传统搜索引擎
百度,谷歌,360……
传统的搜索引擎能够有效的抓取对方网站页面内容
- 公司动态
- 组织文档
- 用户名 /密码
- 测试文件
- 历史数据
传统搜索引擎是对网页内容,网页标题的关键字进行抓取
3. Google hack 语法
常见的Google语法
? // 帮助我们快速缩小目标搜索范围
site: 搜索范围限制在某网站或顶级域名中
inurl: 用于搜索网页上包含的URL. 这个语法对寻找网页上的搜索,帮助之类的很有用.
intext: 只搜索网页部分中包含的文字(也就是忽略了标题,URL等的文字).
intitle:限制你搜索的网页标题.
filetype:搜索文件的后缀或者扩展名
……
例如 : filetype:xls "身份证"
? intext:password "Login Info" filetype:txt
? // 不能保证我们下载的文件的安全性
谷歌镜像站
? http://tools.bugscaner.com/google/
谷歌黑客数据库
? https://www.exploit-db.com/google-hacking-database
4. 网络空间引擎
基于物联网搜索,搜索联网的网络设备
在线的暴露的网络设备:路由器,主机,智能电视,联网设备
- 钟馗之眼 https://www.zoomeye.org
- Shadan https://www.shodan.io
- fofa https://fofa.so
- 傻蛋 https://www.oshadan.com
- Dnsdb搜索 https://www.dnsdb.io/zh-cn
通过网络空间搜索引擎,我们能够找到开放的服务以及在线的网络设备
5. 精细化搜索
- 微信公众号 https://weixin.sogou.com
- 知乎相关 https://www.zhihu.com/search?q=
- 微博相关 https://s.weibo.com/?Refer=
- 购物 https://search.jd.com/Search?enc=utf-8&keyword=
- github https://github.com/search?q=
- 贴吧 https://tieba.baidu.com/f/search/res?qw=