Google haiking技术手册 google信息收集

一.  黄金法则

1.      google查询是不区分大小写的。(除布尔操作符OR)

2.      google通配符;(*仅代表搜索词组中的一个词。在一个词的开始或结尾使用星号和直接使用这个单词的效果相同。

  1.     Google 会智能地保留一些内容,比如一些过时的词,一些不适合呈现的内容(比如违法信息

4.      32个单词的限制;(如一串英文单词,如果用*部分替换单词,可以扩展搜索单词的数量)

5.      最常用的:”关键字” ,双引号会使Google强制搜索包含关键字的内容

二.  基础知识

1. +和“”:   +后面关键字;”关键字” ,双引号会使Google强制搜索包含关键字的内容

2. NOT 和 – :      从查询中忽略一个单词,-后不能跟空格

3. OR 和 | :查找搜索中的一个或另外一个关键字;这个方法容易让人迷惑;在google处理搜索查询中,运算符之间没有优先级,一律从左往右,如下例子:

Intext:password |passcode intext:username | userid | user filetype:csv

查找所有文档的文本中包含password或则passcode的页面,在这些页面中,只要求显示出包含username,userid或则user的页面, 在这些页面中,只显示CSV文件。

这条语句让新手容易迷惑;可以借助“()”来消除迷惑,因为google会忽略”()“:

Intext:(password | passcode)intext:(username | userid | user) filetype:csv

4.   .句号可以匹配任意字符

三.  学会用Google URL

其实就是抛开搜索提交框,一种高效简洁的通过url查询方式

例如google最基本的查询URL   www.google.com/search?q=ihackstuff

1.      特殊字符采用16进制转换:(依靠浏览器转码)

“i hack stuff”

火狐:https://www.google.com/search?q=%22i%20hack%20stuff%22(新版URL里不显示16进制,但复制后会转码)

IE:https://www.google.com/search?q=%22i%20hack%20stuff%22

2.      URL搜索组合值(略复杂):

变量=值

1) 数字型变量:

Start=0到最大结果数:         显示结果页面,结果0是第一页面结果页面的第一个结果

Num maxResults=1~100:              每页所显示的结果数

Filter=0/1:           0则显示可能重复的结果

As_nlo=最小数                查找as_nlo和as_nhi之间的数

As_nhi=最大数

2) 语言型变量:

Restrict= countryCN  countryUK                                限定位于某个特定的国家的结果

Hl=EN  ZH-CN                     显示结果所用的语言(消息和链接,非搜索结果

lr =  lang_zh-CN lang_en                                               仅显示该种语言的界面 (搜索结果

3) 编码型变量:

Ie = UTF-8                           web搜索的输入编码,google建议使用UTF-8

oe = UTF-8                          web搜索的输出编码,google建议使用UTF-8

4) 文件类型变量:

As_ft =i(包含)    e(排除)               用于包含或排除以as_filetype表示的文件类型

As_filetype=文件扩展名             用于包含或排除以as_ft表示的文件类型

5) 时间型变量:

As_qdr= all(所有结果) m3(过去三个月) m6(过去6个月)   y(过去一年)

6) 网页位置变量:

As_occt= any(网页内任何地方)    title(页面标题)   body(页面文本) url(网页内的网址)     link(网页的链接内)                                                 在指定位置查找搜索关键字

7) 站点或域变量:

As_dt= i(包含)    e(排除)                              包含或则排除由as_sitesearch指定的域

As_sitsearch=域或站点                                                包含或则排除由as_dt指定的域

8) URL值变量:

As_rq=URL                         查找与该URL类似的页面

As_lq=url                             查找链接到该URL的页面

9) 词型变量:

Q和as_q      :搜索查询

As_eq=关键字:    将从搜索关键中的排除的关键字

As_epq=词组                    值作为一个确切的词组进行提交,这样就不需要给词组加上引号

As_oq=词的列表            查找这些词中间的至少一个

10)                     安全开关:

Safe= active(启用安全搜索)   off(禁用安全搜索)

11)                     权限变量:

Right=cc_*                          用特殊的使用权限(政府,商业,非商业等)等位页面

四.  高级操作符

基本语法:       operator:search_term

1.      规则:

1) 在操作符、冒号、搜索关键字之间是没有空格的;且空格可以当作语法的结尾

2) 搜索部分以 单词  或则””引起来的 关键字

3) OR、+不能用于冒号前

4) 高级操作符可以和  单独的查询混用

5) ALL开头的操作符,一次只能用一个

几个例子:

Intitle:”index of”    ====    intitle:index.of    (.可以代替任何字符,这样就可以去掉””)

Intitle:”index of” private   词组包含index of   网页任何地方包含private

Intitle:”index of” “backupfiles”  只对前一个有效,情况跟上面一样

2.      Intitle 与 Allintitle:在页面标题中搜索:

Intitle:”index of” “backup files”  只搜索第一个关键词

Allintitle: ”index of” “backup files”  所有关键词都搜

擅长搜索网页,Group,图片和新闻

3.      Allintext:在网页内容里查找字符串(不能和其他高级操作符混用)

擅长搜索网页,Group,图片和新闻

4.      Inurl与allinurl:在URL中查找文本

Inurl:admin                 搜索的结果URL里出现admin

擅长搜索网页,Group,图片

5.      Site:把搜索精确到特定的站点

Google是从右向左读取服务器名的

Site:blackhat.com

擅长搜索网页,Group,图片

6.      Filetype与ext:搜索指定类型的文件

擅长搜索网页,Group

文件类型:                                                               文件扩展名:

Adobe Portable Document Format                  Pdf

Adobe PostScript                                                     Ps

Lotus 1-2-3                                                                  wk1-2-3-4-5、wki、wks、wku

Lotus WordPro                                                          Lwp

MacWrite                                                                    Mw

Microsoft Excel                                                         Xls

Microsoft PowerPoint                                           Ppt

Microsoft Word                                                        Doc

Microsoft Works                                                      wks、wps、wdb

Microsoft Write                                                        Wri

Rich Text Format                                                      Rtf

Shockwave Flash                                                      Swf

Text                                                                               ans、txt

7.      Link:搜索与当前网页存在的链接的网页

Link:www.baidu.com                   如果URL不标准,即会无效

8.      Inanchor:在链接文本中查找文本

Inanchor:关键词                                      搜索的是锚点,或则说是链接上显示的文本

9.      Cache:显示网页的缓存版本(类似快照,直接打开某个页面的缓存版本,而不是Google搜索

不能很好和其他操作符混用

Cache:baidu.com

10.  Numrange:搜索数字(给最小数和最大数)(听说此功能异常强大)

Numrange:12344-12346   =======  12344..12346   两种等价,结果是12345

与exi同效

11.  Daterange:查找在某个特定日期范围内发布的网页

Datarange:2452164-2452164  搜索2001年9月11日(儒略历,公元前4713年1月1日所经过的天数)

单独使用没有结果,也可以使用as_qdr来得到相似结果

12.   Info:显示Google的摘要信息

Info:URL   结果是该URL的摘要信息和相关链接      (不能和其他操作符混合使用)

13.  Related:显示相关站点(google断定有关的)(不能和其他操作符使用)

可以看到。Wooyun,91ri,看雪著名安全论坛

14.  Author:搜索Groups中新闻组帖子的作者

Author:用户名或者e-mail

只能在GoogleGroups中使用

15.  Group:搜索Group标题

Group:windows  得到的结果是描述windows的,结果可能并不包含windows

16.  Insubject:搜索Google Group主题行

其实和intitle是一样的。  主题描述标题更为准确

17.  Msgid:通过消息ID来查找Group帖子(被as_msgid代替了)

Msgid:xxx@yyy.com

18.  Stocks:搜索股票信息

Stock:股票简称

19.  Define:显示某个术语的定义

20.  Phonebook:搜索电话列表

Rphonebook  住宅电话列表

Bphonebook  商业电话列表

Phonebook:johndarling ny    列出johnDarling 在NewYork 的商业与住宅电话列表

About hackgoo 110 Articles
渗透测试人员,信息安全维护 主要技能web安全,linux运维 站在巨人的肩膀上,在学习中进步,在进步中学习,低调求生存 极客谷保留所有权利,转载请注明出处

Be the first to comment

Leave a Reply

Your email address will not be published.


*