BD-23-2 Big Data Acquisition and Preprocessing – 大数据采集和预处理
10.00€
- Big Data Acquisition and Preprocessing
- 0 (Registered)
10.00€
Curriculum
- 5 Sections
- 34 Lessons
- Lifetime
Expand all sectionsCollapse all sections
- 1. Einleitung - 简介2
- 2. Vorbereitung des Phthon-Crawler-Projekts - PYTHON爬虫项目的准备4
- 3. Technologien - 技术24
- 3.03.1 Übliche Anti-Crawling-Verfahren – 常规防爬程序
- 3.13.1.1 Login-Wall – 登录墙
- 3.23.1.2 Reputation der IP-Adresse – IP地址阻止
- 3.33.1.3 User-Agent und HTTP-Header – 用户代理和HTTP头
- 3.43.1.4 Honeypots/Falsche Daten – 诱导(HONEYPOTS)/虚假数据
- 3.53.1.5 Javascript
- 3.63.1.6 CAPTCHAS
- 3.73.2 Auth Code – 验证码
- 3.83.2.1 Username/Passwort – 用户名/密码
- 3.93.2.2 CSRF
- 3.103.3 Proxy-IP-Pooltechnologie – 代理IP池化技术
- 3.113.3.1 Datacenter Proxys – 数据中心代理
- 3.123.3.2 Residential Network – 住宅网络
- 3.133.3.3 ISP Proxys – ISP代理
- 3.143.3.4 Mobile Proxys – 移动代理
- 3.153.4 User Agent-Pool-Technologie – 用户代理池化技术
- 3.163.4.1 Aufbau – 结构
- 3.173.4.2 Polytechnologie in Python – PYTHON中的池化技术
- 3.183.5 Regulärer Ausdruck – 正则表达式 / Grundlagen – 基础
- 3.193.5.2 Auswertung in Python – PYTHON中的评估
- 3.203.5.3 Auswertung in Java – JAVA评估
- 3.213.6 XPATH -Ausdruck – XPATH表达式
- 3.223.6.1 Wiederholung: Grundlagen XML& HTML – 重复:基础XML和HTML
- 3.233.6.2 XPATH-Grundlagen -XPATH基础
- 4. Packet-Capturing - 数据包捕获3
- Literaturverzeichnis - 参考文献1