crawl4ai/docs/md_v2/advanced/proxy-security.md

# Proxy & Security

Configure proxy settings and enhance security features in Crawl4AI for reliable data extraction.

## Basic Proxy Setup

Simple proxy configuration with `BrowserConfig`:

```python
from crawl4ai.async_configs import BrowserConfig

# Using proxy URL
browser_config = BrowserConfig(proxy="http://proxy.example.com:8080")
async with AsyncWebCrawler(config=browser_config) as crawler:
    result = await crawler.arun(url="https://example.com")

# Using SOCKS proxy
browser_config = BrowserConfig(proxy="socks5://proxy.example.com:1080")
async with AsyncWebCrawler(config=browser_config) as crawler:
    result = await crawler.arun(url="https://example.com")
```

## Authenticated Proxy

Use an authenticated proxy with `BrowserConfig`:

```python
from crawl4ai.async_configs import BrowserConfig

proxy_config = {
    "server": "http://proxy.example.com:8080",
    "username": "user",
    "password": "pass"
}

browser_config = BrowserConfig(proxy_config=proxy_config)
async with AsyncWebCrawler(config=browser_config) as crawler:
    result = await crawler.arun(url="https://example.com")
```

## Rotating Proxies

Example using a proxy rotation service and updating `BrowserConfig` dynamically:

```python
from crawl4ai.async_configs import BrowserConfig

async def get_next_proxy():
    # Your proxy rotation logic here
    return {"server": "http://next.proxy.com:8080"}

browser_config = BrowserConfig()
async with AsyncWebCrawler(config=browser_config) as crawler:
    # Update proxy for each request
    for url in urls:
        proxy = await get_next_proxy()
        browser_config.proxy_config = proxy
        result = await crawler.arun(url=url, config=browser_config)
```

## Custom Headers

Add security-related headers via `BrowserConfig`:

```python
from crawl4ai.async_configs import BrowserConfig

headers = {
    "X-Forwarded-For": "203.0.113.195",
    "Accept-Language": "en-US,en;q=0.9",
    "Cache-Control": "no-cache",
    "Pragma": "no-cache"
}

browser_config = BrowserConfig(headers=headers)
async with AsyncWebCrawler(config=browser_config) as crawler:
    result = await crawler.arun(url="https://example.com")
```

## Combining with Magic Mode

For maximum protection, combine proxy with Magic Mode via `CrawlerRunConfig` and `BrowserConfig`:

```python
from crawl4ai.async_configs import BrowserConfig, CrawlerRunConfig

browser_config = BrowserConfig(
    proxy="http://proxy.example.com:8080",
    headers={"Accept-Language": "en-US"}
)
crawler_config = CrawlerRunConfig(magic=True)  # Enable all anti-detection features

async with AsyncWebCrawler(config=browser_config) as crawler:
    result = await crawler.arun(url="https://example.com", config=crawler_config)
```
Update Documentation 2024-10-27 19:24:46 +08:00			`# Proxy & Security`

			`Configure proxy settings and enhance security features in Crawl4AI for reliable data extraction.`

			`## Basic Proxy Setup`

Enhance Crawl4AI with new features and documentation - Fix crawler text mode for improved performance; cover missing `srcset` and `data_srcset` attributes in image tags. - Introduced Managed Browsers for enhanced crawling experience. - Updated documentation for clearer navigation on configuration. - Changed 'text_only' to 'text_mode' in configuration and methods. - Improved performance and relevance in content filtering strategies. 2024-12-19 21:02:29 +08:00			Simple proxy configuration with `BrowserConfig`:
Update Documentation 2024-10-27 19:24:46 +08:00
			```python
Enhance Crawl4AI with new features and documentation - Fix crawler text mode for improved performance; cover missing `srcset` and `data_srcset` attributes in image tags. - Introduced Managed Browsers for enhanced crawling experience. - Updated documentation for clearer navigation on configuration. - Changed 'text_only' to 'text_mode' in configuration and methods. - Improved performance and relevance in content filtering strategies. 2024-12-19 21:02:29 +08:00			`from crawl4ai.async_configs import BrowserConfig`

Update Documentation 2024-10-27 19:24:46 +08:00			`# Using proxy URL`
Enhance Crawl4AI with new features and documentation - Fix crawler text mode for improved performance; cover missing `srcset` and `data_srcset` attributes in image tags. - Introduced Managed Browsers for enhanced crawling experience. - Updated documentation for clearer navigation on configuration. - Changed 'text_only' to 'text_mode' in configuration and methods. - Improved performance and relevance in content filtering strategies. 2024-12-19 21:02:29 +08:00			`browser_config = BrowserConfig(proxy="http://proxy.example.com:8080")`
			`async with AsyncWebCrawler(config=browser_config) as crawler:`
Update Documentation 2024-10-27 19:24:46 +08:00			`result = await crawler.arun(url="https://example.com")`

			`# Using SOCKS proxy`
Enhance Crawl4AI with new features and documentation - Fix crawler text mode for improved performance; cover missing `srcset` and `data_srcset` attributes in image tags. - Introduced Managed Browsers for enhanced crawling experience. - Updated documentation for clearer navigation on configuration. - Changed 'text_only' to 'text_mode' in configuration and methods. - Improved performance and relevance in content filtering strategies. 2024-12-19 21:02:29 +08:00			`browser_config = BrowserConfig(proxy="socks5://proxy.example.com:1080")`
			`async with AsyncWebCrawler(config=browser_config) as crawler:`
Update Documentation 2024-10-27 19:24:46 +08:00			`result = await crawler.arun(url="https://example.com")`
			```

			`## Authenticated Proxy`

Enhance Crawl4AI with new features and documentation - Fix crawler text mode for improved performance; cover missing `srcset` and `data_srcset` attributes in image tags. - Introduced Managed Browsers for enhanced crawling experience. - Updated documentation for clearer navigation on configuration. - Changed 'text_only' to 'text_mode' in configuration and methods. - Improved performance and relevance in content filtering strategies. 2024-12-19 21:02:29 +08:00			Use an authenticated proxy with `BrowserConfig`:
Update Documentation 2024-10-27 19:24:46 +08:00
			```python
Enhance Crawl4AI with new features and documentation - Fix crawler text mode for improved performance; cover missing `srcset` and `data_srcset` attributes in image tags. - Introduced Managed Browsers for enhanced crawling experience. - Updated documentation for clearer navigation on configuration. - Changed 'text_only' to 'text_mode' in configuration and methods. - Improved performance and relevance in content filtering strategies. 2024-12-19 21:02:29 +08:00			`from crawl4ai.async_configs import BrowserConfig`

Update Documentation 2024-10-27 19:24:46 +08:00			`proxy_config = {`
			`"server": "http://proxy.example.com:8080",`
			`"username": "user",`
			`"password": "pass"`
			`}`

Enhance Crawl4AI with new features and documentation - Fix crawler text mode for improved performance; cover missing `srcset` and `data_srcset` attributes in image tags. - Introduced Managed Browsers for enhanced crawling experience. - Updated documentation for clearer navigation on configuration. - Changed 'text_only' to 'text_mode' in configuration and methods. - Improved performance and relevance in content filtering strategies. 2024-12-19 21:02:29 +08:00			`browser_config = BrowserConfig(proxy_config=proxy_config)`
			`async with AsyncWebCrawler(config=browser_config) as crawler:`
Update Documentation 2024-10-27 19:24:46 +08:00			`result = await crawler.arun(url="https://example.com")`
			```

			`## Rotating Proxies`

Enhance Crawl4AI with new features and documentation - Fix crawler text mode for improved performance; cover missing `srcset` and `data_srcset` attributes in image tags. - Introduced Managed Browsers for enhanced crawling experience. - Updated documentation for clearer navigation on configuration. - Changed 'text_only' to 'text_mode' in configuration and methods. - Improved performance and relevance in content filtering strategies. 2024-12-19 21:02:29 +08:00			Example using a proxy rotation service and updating `BrowserConfig` dynamically:
Update Documentation 2024-10-27 19:24:46 +08:00
			```python
Enhance Crawl4AI with new features and documentation - Fix crawler text mode for improved performance; cover missing `srcset` and `data_srcset` attributes in image tags. - Introduced Managed Browsers for enhanced crawling experience. - Updated documentation for clearer navigation on configuration. - Changed 'text_only' to 'text_mode' in configuration and methods. - Improved performance and relevance in content filtering strategies. 2024-12-19 21:02:29 +08:00			`from crawl4ai.async_configs import BrowserConfig`

Update Documentation 2024-10-27 19:24:46 +08:00			`async def get_next_proxy():`
			`# Your proxy rotation logic here`
			`return {"server": "http://next.proxy.com:8080"}`

Enhance Crawl4AI with new features and documentation - Fix crawler text mode for improved performance; cover missing `srcset` and `data_srcset` attributes in image tags. - Introduced Managed Browsers for enhanced crawling experience. - Updated documentation for clearer navigation on configuration. - Changed 'text_only' to 'text_mode' in configuration and methods. - Improved performance and relevance in content filtering strategies. 2024-12-19 21:02:29 +08:00			`browser_config = BrowserConfig()`
			`async with AsyncWebCrawler(config=browser_config) as crawler:`
Update Documentation 2024-10-27 19:24:46 +08:00			`# Update proxy for each request`
			`for url in urls:`
			`proxy = await get_next_proxy()`
Enhance Crawl4AI with new features and documentation - Fix crawler text mode for improved performance; cover missing `srcset` and `data_srcset` attributes in image tags. - Introduced Managed Browsers for enhanced crawling experience. - Updated documentation for clearer navigation on configuration. - Changed 'text_only' to 'text_mode' in configuration and methods. - Improved performance and relevance in content filtering strategies. 2024-12-19 21:02:29 +08:00			`browser_config.proxy_config = proxy`
			`result = await crawler.arun(url=url, config=browser_config)`
Update Documentation 2024-10-27 19:24:46 +08:00			```

			`## Custom Headers`

Enhance Crawl4AI with new features and documentation - Fix crawler text mode for improved performance; cover missing `srcset` and `data_srcset` attributes in image tags. - Introduced Managed Browsers for enhanced crawling experience. - Updated documentation for clearer navigation on configuration. - Changed 'text_only' to 'text_mode' in configuration and methods. - Improved performance and relevance in content filtering strategies. 2024-12-19 21:02:29 +08:00			Add security-related headers via `BrowserConfig`:
Update Documentation 2024-10-27 19:24:46 +08:00
			```python
Enhance Crawl4AI with new features and documentation - Fix crawler text mode for improved performance; cover missing `srcset` and `data_srcset` attributes in image tags. - Introduced Managed Browsers for enhanced crawling experience. - Updated documentation for clearer navigation on configuration. - Changed 'text_only' to 'text_mode' in configuration and methods. - Improved performance and relevance in content filtering strategies. 2024-12-19 21:02:29 +08:00			`from crawl4ai.async_configs import BrowserConfig`

Update Documentation 2024-10-27 19:24:46 +08:00			`headers = {`
			`"X-Forwarded-For": "203.0.113.195",`
			`"Accept-Language": "en-US,en;q=0.9",`
			`"Cache-Control": "no-cache",`
			`"Pragma": "no-cache"`
			`}`

Enhance Crawl4AI with new features and documentation - Fix crawler text mode for improved performance; cover missing `srcset` and `data_srcset` attributes in image tags. - Introduced Managed Browsers for enhanced crawling experience. - Updated documentation for clearer navigation on configuration. - Changed 'text_only' to 'text_mode' in configuration and methods. - Improved performance and relevance in content filtering strategies. 2024-12-19 21:02:29 +08:00			`browser_config = BrowserConfig(headers=headers)`
			`async with AsyncWebCrawler(config=browser_config) as crawler:`
Update Documentation 2024-10-27 19:24:46 +08:00			`result = await crawler.arun(url="https://example.com")`
			```

			`## Combining with Magic Mode`

Enhance Crawl4AI with new features and documentation - Fix crawler text mode for improved performance; cover missing `srcset` and `data_srcset` attributes in image tags. - Introduced Managed Browsers for enhanced crawling experience. - Updated documentation for clearer navigation on configuration. - Changed 'text_only' to 'text_mode' in configuration and methods. - Improved performance and relevance in content filtering strategies. 2024-12-19 21:02:29 +08:00			For maximum protection, combine proxy with Magic Mode via `CrawlerRunConfig` and `BrowserConfig`:
Update Documentation 2024-10-27 19:24:46 +08:00
			```python
Enhance Crawl4AI with new features and documentation - Fix crawler text mode for improved performance; cover missing `srcset` and `data_srcset` attributes in image tags. - Introduced Managed Browsers for enhanced crawling experience. - Updated documentation for clearer navigation on configuration. - Changed 'text_only' to 'text_mode' in configuration and methods. - Improved performance and relevance in content filtering strategies. 2024-12-19 21:02:29 +08:00			`from crawl4ai.async_configs import BrowserConfig, CrawlerRunConfig`

			`browser_config = BrowserConfig(`
Update Documentation 2024-10-27 19:24:46 +08:00			`proxy="http://proxy.example.com:8080",`
			`headers={"Accept-Language": "en-US"}`
Enhance Crawl4AI with new features and documentation - Fix crawler text mode for improved performance; cover missing `srcset` and `data_srcset` attributes in image tags. - Introduced Managed Browsers for enhanced crawling experience. - Updated documentation for clearer navigation on configuration. - Changed 'text_only' to 'text_mode' in configuration and methods. - Improved performance and relevance in content filtering strategies. 2024-12-19 21:02:29 +08:00			`)`
			`crawler_config = CrawlerRunConfig(magic=True) # Enable all anti-detection features`

			`async with AsyncWebCrawler(config=browser_config) as crawler:`
			`result = await crawler.arun(url="https://example.com", config=crawler_config)`
			```