从网站中提取电子邮件地址
如果您知道要从中提取电子邮件的网站,请使用此选项。
单击“开始搜索”按钮,输入起始 URL 或 URL 列表后,选择选项并开始搜索。 电子邮件提取器将扫描该网站。
网站选项
- 扫描深度 - 指定页数,定义您希望蜘蛛网站的“深度”。 您必须指定程序要遵循多少个链接级别。 将其设置为 1 将只搜索主页。 设置为 2 将搜索链接到第一个页面的所有页面。 等等。
- 仅此域 - 该程序将仅扫描从搜索引擎接收到的网站链接。
- 仅子文件夹 -该程序将仅扫描指定文件 夹 中 的页面 ,例如 http://domain.com/folder/page.html、http://domain.com/folder/page2.html、http://domain.com /文件夹/ 文件夹2/page3.html
- 改进的页面加载 - 如果您正在抓取多个重要网站,请启用。 禁用大量网站上的大型搜索(将加快搜索速度)
- 人类仿真 - Extractor 会将页面加载到内置浏览器中并模拟人类行为。请注意,使用此选项时,应用程序的扫描速度会更慢。
- 线程 - 同时加载和处理的网页的数量。如果线程的值较大,则比计算机内存提取器使用的更多。我们建议不要超过 50 个线程。
- 提取(电子邮件、电话、Skype) - 选择要从搜索引擎中提取的内容。
高级选项
- 网站扫描 - 在这里您可以限制要在网站中搜索的网页或电子邮件的数量。
- 处理文件类型 - 可以选择提取器在搜索 Web 目录时下载和处理的文件类型。
登录和搜索表单
如果您需要在论坛、社交网络和需要授权的网站上搜索电子邮件,您可以使用登录和搜索表单。输入站点 URL,登录,选择初始搜索网页,加载网站后单击开始搜索。
扫描目录网站
如果要从目录站点提取电子邮件,请使用目录扫描功能。 输入目录网站的 url,在选项中指定目录站点的扫描深度,然后是将在目录中找到的站点的扫描深度(公司网站扫描深度)。 选择所需选项后,单击开始搜索。
如果您在目录链接结构中看到一种模式,则可以为该站点生成链接。 例如目录链接 www.directorysite.com?companyid=102,你可以找到 webdirectory 的第一个链接 www.directorysite.com?companyid=100,最后一个链接 - www.directorysite.com?companyid=805,在生成链接表单中需要输入:
手动模式
如果您无法在正常或人工模拟模式下从网站提取电子邮件,请使用内置网络浏览器在手动模式下收集电子邮件。 在内置网络浏览器中打开网站并浏览网站。 所有找到的电子邮件都将保存在表格中,并在搜索结束时单击保存电子邮件按钮。
网址列表摘录
如果您有包含电子邮件的网页 URL 列表,可以将其复制到网站字段并在选项 - 扫描深度 = 1 中进行设置。
保存结果
要保存结果,请单击 保存 按钮。 向导对话框将打开。
选择应保存的列。 您可以选择仅 电子邮件 列以仅保存电子邮件。 单击下一步按钮 。
在“保存文件” 对话框中指定文件名 ,程序将保存搜索结果。