Crawl Nedir? Google Botlarını Yönetme Sanatı | Gökhan Vatancı
TEKNİK SEO TEMELLERİ

Crawl Nedir?

Google Kapını Çalmazsa, Evde Yoksun Demektir.

GOOGLEBOT_V2.1.EXE
🏠
🕷️
STATUS: CRAWLING...
BOT PARAMETRELERİ
User-Agent Googlebot Smartphone
Crawl Rate
Robots.txt Allowed ✅
LOG ÖNİZLEME
> GET /index.html HTTP/1.1
> 200 OK (145ms)
> Parsing links...
> Found 42 internal links.

Crawl Nedir?

Dürüst olalım: Dünyanın en iyi içeriğini yazmış olabilirsin. Tasarımın Apple'ın web sitesinden bile daha havalı olabilir. Ama Google'ın botları (örümcekleri) sitene gelip o sayfayı taramazsa (crawl), internetin karanlık bir köşesinde kendi kendine konuşuyorsun demektir.

Crawl (Tarama); Googlebot gibi arama motoru botlarının, web sitene gelmesi, sayfalarını gezmesi, linkleri takip etmesi ve "Burada ne varmış?" diye içeriğini analiz etmesi işlemidir. Bu, indekslemenin (dizine eklemenin) ilk ve en hayati adımıdır. Tarama yoksa, sıralama da yok. Nokta.

"Botlar duygu sömürüsü yapmaz, rüşvet yemez. Sadece teknik veriyi ve ulaşılabilirliği okurlar. Onlara kapıyı açmayı öğrenmelisin."

Neden Umursamalısın?

Amatör SEO

"Yazı Girdim Bekliyorum"

İçeriği yayınlar ve Google'ın lütfedip gelmesini bekler. Robot.txt dosyasının varlığından bile habersizdir. Sayfalar aylar sonra indekse girer (veya hiç girmez). "Neden hit alamıyorum?" diye ağlar.

Neuro-SEO Mimarı

"Bota Yol Haritası Çiziyorum"

Crawl Bütçesini optimize eder. Botun hangi sayfaya, ne sıklıkla geleceğini manipüle eder. Gereksiz sayfaları (admin paneli, sepet vb.) botun yolundan çeker. İçeriği yayınladığı dakika Google'ın kapısına dayanır.

Bilmen Gereken Terimler

🕷️

Googlebot (Spider)

Google'ın sahadaki işçisidir. Linkleri takip eder, HTML kodlarını okur ve veriyi merkeze (indeks) taşır. Yorulmaz ama kafası karışabilir.

💰

Crawl Budget

Google'ın sitenize ayırdığı zaman ve kaynak limitidir. Siten yavaşsa veya çok hatayla doluysa, bot "Zamanım bitti" der ve yeni sayfalarını taramadan gider.

🚧

Robots.txt

Sitenin kapıdaki güvenliğidir. Bota "Buraya gir (Allow)" veya "Burası yasak (Disallow)" komutunu verir. Yanlış yapılandırırsan botu tamamen engellersin.

🗺️

Sitemap.xml

Botun eline verdiğin haritadır. "En önemli sayfalarım bunlar, bunları mutlaka gez" dersin. İçeriğin dağınıksa bu harita hayat kurtarır.

🆔

User-Agent

Siteni ziyaret eden botun kimliğidir. Googlebot Desktop ve Googlebot Smartphone en yaygın olanlarıdır. Siteniz artık %100 mobil bota göre taranıyor.

🚦

Status Codes

Botun sitenle konuştuğu dildir. 200 (Her şey yolunda), 404 (Sayfa yok), 500 (Sunucu patladı), 301 (Taşındık). Bot bu kodlara göre hareket eder.

Sistemi Nasıl Yönetirsin?

01

Kapıdaki Güvenliği Ayarla (Robots.txt)

Eğer robots.txt dosyan yanlışsa, dünyanın en iyi SEO uzmanını da getirsen işe yaramaz. Botu sitene davet etmelisin, ama yatak odana (admin paneline) sokmamalısın.

  • domain.com/robots.txt adresine git.
  • User-agent: * (Tüm botlar için)
  • Disallow: komutlarına dikkat et. Ana dizini engellemediğinden emin ol.
User-agent: *
Disallow: /wp-admin/
Disallow: /sepet/
Allow: /wp-admin/admin-ajax.php

# Sitemap location
Sitemap: https://site.com/sitemap.xml
Ana Sayfa
Kategori A
Kategori B
Ölü Sayfa ⚠️
02

İç Linkleme ile Botu Yönlendir

Botlar linkleri takip ederek hareket eder. Eğer bir sayfana sitenin hiçbir yerinden link vermediysen (Orphan Page / Yetim Sayfa), bot orayı bulamaz.

Taktik: En önemli sayfalarına ana sayfadan ve popüler blog yazılarından link ver. Botu elinden tut ve "Bak bu sayfa çok önemli, burayı mutlaka tara" de.

God Mode: Log Analizi 🕵️‍♂️

Google Search Console sana "nelerin yanlış gittiğini" söyler. Ama sunucu log dosyaların sana "botun tam olarak ne yaptığını" söyler. Sektörün %99'u buraya bakmaz.

// server_access.log (Bot İzleme)
66.249.66.1 - - [14/Jan/2026:10:00:01] "GET /yeni-urun.html HTTP/1.1" 200 5420 "-" "Mozilla/5.0... Googlebot/2.1"
66.249.66.1 - - [14/Jan/2026:10:00:02] "GET /silinmis-sayfa HTTP/1.1" 404 120 "-" "Googlebot/2.1" // Bot burada 404 hatası aldı! Kaynak israfı.
66.249.66.1 - - [14/Jan/2026:10:00:03] "GET /kategori-a HTTP/1.1" 301 420 "-" "Googlebot/2.1"

Gökhan'ın Notu: Eğer loglarda Googlebot'un sürekli 404 sayfalarına veya 301 zincirlerine (redirect chains) gittiğini görüyorsan, Crawl Bütçeni çöpe atıyorsun demektir. Hemen düzelt.

Sakın Yapma!

NoIndex Koyup Beklemek

Sayfaya 'noindex' etiketi koymak taramayı engellemez, sadece indeksi engeller. Bot hala oraya gidip kaynak harcar. Taramayı engellemek için robots.txt kullan.

🐢

Yavaş Sunucu Yanıtı

Googlebot sabırsızdır. Sunucun 2 saniyede yanıt vermiyorsa, bot sayfayı taramadan terk eder. Hız, crawl bütçesini artırır.

🔗

Sonsuz Link Döngüleri

Takvim sayfaları veya bitmeyen filtreler botu tuzağa düşürür (Spider Trap). Bot sonsuz sayıda URL üretip hepsini taramaya çalışırsa siten batar.

Kafana Takılanlar

Crawl ile Index arasındaki fark nedir?

Crawl (Tarama), botun sayfayı bulması ve okumasıdır. Index (Dizin), okuduğu bu bilgiyi veritabanına kaydetmesidir. Her taranan sayfa indekse girmez, ama taranmayan sayfa asla indekse giremez.

Google sitemi ne sıklıkla tarar?

Bu sitenin otoritesine ve güncelleme sıklığına bağlıdır. Haber siteleri dakikada bir taranırken, statik bir blog haftada bir taranabilir. "Crawl Stats" raporundan bunu görebilirsin.

Botların sitemi taramasını nasıl hızlandırırım?

Sunucu yanıt süresini düşür, site haritanı GSC'ye gönder, iç linklemeyi güçlendir ve en önemlisi düzenli, özgün içerik gir. Bot hareketliliği sever.

🚀 Siten Google'ın Radarına Girmiyor mu?

Crawl bütçen çöp mü oluyor? Sayfaların indekse girmekte zorlanıyor mu? Teknik SEO ve tarama sorunlarını profesyonel bir bakış açısıyla, cerrah titizliğinde çözelim.

Gökhan Vatancı ile Hızlıca Görüşün
Picture of <b>Gökhan Vatancı</b>
Gökhan Vatancı

Freelance SEO Uzmanı

Bir yanıt yazın

E-posta adresiniz yayınlanmayacak. Gerekli alanlar * ile işaretlenmişlerdir