DeepSeek-OCR : DeepSeek OCR PDF
DeepSeek-OCR, karmaşık düzenler, el yazısı, grafikler ve matematiksel formüller için özel yeteneklere sahip, 100'den fazla dildeki resimlerden ve belgelerden metni doğru bir şekilde çıkaran gelişmiş bir yapay zeka destekli optik karakter tanıma modelidir.
Temel Özellikler
DeepSeek-OCR, resimlerden ve belgelerden metinleri verimli bir şekilde çıkarmak için bağlamsal optik sıkıştırma ile en son yapay zeka teknolojisini kullanan gelişmiş bir optik karakter tanıma modelidir.
Çoklu Dil Desteği
İngilizce, Çince, Japonca, Korece, Arapça, Kiril ve Hint dilleri dahil olmak üzere 100'den fazla dildeki metinleri yüksek doğrulukla tanır.
Yüksek Hızlı İşleme
Saniyede 2.500'e kadar jeton hızında, tek bir A100-40G GPU'da günde 200.000'den fazla sayfayı işler.
Gelişmiş OCR 2.0 Yetenekleri
Grafik ayrıştırma, karmaşık formül tanıma, geometrik şekil anlama ve derin belge yapısı analizi ile basit metin çıkarmanın ötesine geçer.
Karmaşık Düzen Anlayışı
Tablolar, formlar dahil olmak üzere karmaşık düzenlere sahip belgelerden metni doğru bir şekilde çıkarır ve Markdown'a dönüştürürken biçimlendirmeyi korur.
El Yazısı Tanıma
Gelişmiş görsel jeton işleme ile hem el yazısı hem de basılı el yazısında %92'nin üzerinde doğruluk sağlar.
Öncelikle Gizlilik İşlemi
Şifreli işleme ve 24 saat içinde otomatik silme ile veri güvenliğini sağlar, kendi kendine barındırılan dağıtım seçenekleri mevcuttur.
Kullanım Alanları
DeepSeek-OCR, basit metin çıkarmadan karmaşık akademik ve ticari uygulamalara kadar çok çeşitli belge işleme senaryolarında mükemmeldir.
Belge Dijitalleştirme
Basılı arşivleri, tarihi belgeleri ve taranmış kitapları, korunan biçimlendirme ve yapıyla düzenlenebilir dijital biçimlere dönüştürün.
İş Otomasyonu
İş akışlarını kolaylaştırmak ve manuel işlem süresini azaltmak için faturalardan, makbuzlardan, sözleşmelerden ve formlardan veri girişini otomatikleştirin.
Akademik Araştırma
Matematiksel formüller, kimyasal denklemler ve karmaşık diyagramlar dahil olmak üzere araştırma makalelerini, ders kitaplarını ve bilimsel belgeleri işleyin.
Çok Dilli İçerik Yönetimi
Uluslararası kuruluşlar ve çeviri hizmetleri için mükemmel olan manuel müdahale olmadan birden çok dil içeren belgeleri işleyin.
Görsellerden Veri Çıkarma
Analiz ve raporlama amacıyla grafiklerden, tablolardan, tablolardan ve teknik çizimlerden veri çıkarın.
El Yazısı Dijitalleştirme
Arşivleme ve aranabilirlik için el yazısı notları, formları ve imzaları yüksek doğrulukla dijital metne dönüştürün.
DeepSeek-OCR için İstem Kılavuzu
Çeşitli belge işleme görevleri için DeepSeek-OCR'yi etkili bir şekilde kullanma sanatında ustalaşın
Etkili OCR için Temel Unsurlar
Görüntü Kalitesi
Optimum metin tanıma için görüntülerin net, iyi aydınlatılmış ve yeterli çözünürlüğe (minimum 300 DPI önerilir) sahip olduğundan emin olun.
Belge Türü Belirtimi
Modelin tanıma kalıplarını optimize etmesine yardımcı olmak için işlediğiniz belge türünü belirtin.
Dil Bağlamı
Model dilleri otomatik olarak algılarken, birincil dili belirtmek, karma dil belgeleri için doğruluğu artırabilir.
Çıktı Biçimi Tercihi
Tercih ettiğiniz çıktı biçimini tanımlayın - düz metin, korunan biçimlendirmeye sahip Markdown veya yapılandırılmış veri çıkarma.
Profesyonel İpuçları
Verimlilik için Toplu İşleme
A100-40G GPU'da ~2.500 jeton/sn'lik optimum verim elde etmek için büyük belge kümeleri için vLLM toplu işlemeyi kullanın.
El Yazısı Metin için Ön İşleme
El yazısı belgeler için yeterli aydınlatma ve kontrast sağlayın. Düz hizalama, tanıma doğruluğunu %92'nin üzerine çıkarır.
Gelişmiş Özelliklerden Yararlanın
Karmaşık görsel öğeler içeren bilimsel makaleler ve teknik belgeler için grafik ayrıştırma ve formül tanıma yeteneklerini kullanın.
Hassas Veriler için Kendi Kendine Barındırma
Gizli belgeleri işlerken maksimum gizlilik ve kontrol için kendi altyapınızda dağıtın.
Temel ve Gelişmiş OCR Kullanımı Karşılaştırması
"Görüntü yükle → Metin çıkar → Düz metin çıktısı"
"Görüntü yükle → Belge türünü belirt → Yapı korumayı etkinleştir → Tablolar, formüller ve biçimlendirme bozulmadan Markdown alın"
"Yalnızca İngilizce belgeleri işle"
"Otomatik algılama ve karma dil desteği ile aynı anda 100'den fazla dildeki belgeleri işle"
"Basit belgelerden düz metin çıkar"
"Metin çıkarın, grafikleri ayrıştırın, formülleri tanıyın, geometrik şekilleri anlayın ve eksiksiz belge yapısını koruyun"
DeepSeek-OCR Nasıl Kullanılır
İhtiyaçlarınıza göre uyarlanmış birden çok dağıtım seçeneğiyle DeepSeek-OCR'yi kullanmaya başlayın.
Dağıtım Yönteminizi Seçin
Hız, ölçek ve gizlilik gereksinimlerinize göre çevrimiçi araç, Python API, vLLM toplu işleme veya kendi kendine barındırılan dağıtım arasından seçim yapın.
Belgenizi Yükleyin
Web arayüzü veya API aracılığıyla resimleri veya PDF dosyalarını yükleyin. Desteklenen biçimler arasında JPG, PNG, TIFF ve çok sayfalı PDF bulunur.
İşleme Seçeneklerini Yapılandırın
Belge türünü, dil tercihlerini ve çıktı biçimini belirtin. Gerekirse grafik ayrıştırma veya formül tanıma gibi gelişmiş özellikleri etkinleştirin.
İşle ve İncele
Belgenizi işlenmek üzere gönderin. Model, korunan yapı, biçimlendirme ile metni çıkaracak ve karmaşık öğeleri otomatik olarak işleyecektir.
Sonuçları Dışa Aktar veya Entegre Et
Çıkarılan metni tercih ettiğiniz biçimde indirin veya otomatik işleme hatları için API aracılığıyla doğrudan iş akışınıza entegre edin.
En İyi Uygulamalar
- •En iyi doğruluk için yüksek çözünürlüklü görüntüler (300 DPI veya daha yüksek) kullanın
- •Büyük belge kümeleri için maksimum verim elde etmek için vLLM toplu işlemeyi kullanın
- •Biçimlendirilmiş belgeler, tablolar veya akademik makalelerle çalışırken yapı korumayı etkinleştirin
- •Hassas veya gizli belgeleri işlemek için kendi kendine barındırılan dağıtımı düşünün
- •Belirli kullanım durumunuz için ayarları optimize etmek için önce örnek belgelerle test edin
DeepSeek-OCR 100'den fazla dili destekler ve karmaşık düzenlere, formüllere ve grafiklere sahip belgeleri işler. Üretim iş yükleri için optimum performans için Python API'sini veya vLLM toplu işlemeyi kullanmayı düşünün.
Sıkça Sorulan Sorular
DeepSeek-OCR hakkında sık sorulan sorular ve modelden en iyi şekilde nasıl yararlanılacağı.
Belge İşleme Sürecinizi Dönüştürmeye Hazır mısınız?
DeepSeek-OCR'nin 100'den fazla dil, grafik ayrıştırma ve karmaşık düzen anlayışı desteğiyle gelişmiş optik karakter tanıma gücünü deneyimleyin.
MIT Lisansı altında kullanılabilen açık kaynaklı model. Maksimum gizlilik ve kontrol için çevrimiçi dağıtın veya kendi kendinize barındırın.