D

DeepSeek-OCR : DeepSeek OCR PDF

DeepSeek-OCR, karmaşık düzenler, el yazısı, grafikler ve matematiksel formüller için özel yeteneklere sahip, 100'den fazla dildeki resimlerden ve belgelerden metni doğru bir şekilde çıkaran gelişmiş bir yapay zeka destekli optik karakter tanıma modelidir.

Temel Özellikler

DeepSeek-OCR, resimlerden ve belgelerden metinleri verimli bir şekilde çıkarmak için bağlamsal optik sıkıştırma ile en son yapay zeka teknolojisini kullanan gelişmiş bir optik karakter tanıma modelidir.

Çoklu Dil Desteği

İngilizce, Çince, Japonca, Korece, Arapça, Kiril ve Hint dilleri dahil olmak üzere 100'den fazla dildeki metinleri yüksek doğrulukla tanır.

Yüksek Hızlı İşleme

Saniyede 2.500'e kadar jeton hızında, tek bir A100-40G GPU'da günde 200.000'den fazla sayfayı işler.

Gelişmiş OCR 2.0 Yetenekleri

Grafik ayrıştırma, karmaşık formül tanıma, geometrik şekil anlama ve derin belge yapısı analizi ile basit metin çıkarmanın ötesine geçer.

Karmaşık Düzen Anlayışı

Tablolar, formlar dahil olmak üzere karmaşık düzenlere sahip belgelerden metni doğru bir şekilde çıkarır ve Markdown'a dönüştürürken biçimlendirmeyi korur.

El Yazısı Tanıma

Gelişmiş görsel jeton işleme ile hem el yazısı hem de basılı el yazısında %92'nin üzerinde doğruluk sağlar.

Öncelikle Gizlilik İşlemi

Şifreli işleme ve 24 saat içinde otomatik silme ile veri güvenliğini sağlar, kendi kendine barındırılan dağıtım seçenekleri mevcuttur.

Kullanım Alanları

DeepSeek-OCR, basit metin çıkarmadan karmaşık akademik ve ticari uygulamalara kadar çok çeşitli belge işleme senaryolarında mükemmeldir.

Belge Dijitalleştirme

Basılı arşivleri, tarihi belgeleri ve taranmış kitapları, korunan biçimlendirme ve yapıyla düzenlenebilir dijital biçimlere dönüştürün.

İş Otomasyonu

İş akışlarını kolaylaştırmak ve manuel işlem süresini azaltmak için faturalardan, makbuzlardan, sözleşmelerden ve formlardan veri girişini otomatikleştirin.

Akademik Araştırma

Matematiksel formüller, kimyasal denklemler ve karmaşık diyagramlar dahil olmak üzere araştırma makalelerini, ders kitaplarını ve bilimsel belgeleri işleyin.

Çok Dilli İçerik Yönetimi

Uluslararası kuruluşlar ve çeviri hizmetleri için mükemmel olan manuel müdahale olmadan birden çok dil içeren belgeleri işleyin.

Görsellerden Veri Çıkarma

Analiz ve raporlama amacıyla grafiklerden, tablolardan, tablolardan ve teknik çizimlerden veri çıkarın.

El Yazısı Dijitalleştirme

Arşivleme ve aranabilirlik için el yazısı notları, formları ve imzaları yüksek doğrulukla dijital metne dönüştürün.

DeepSeek-OCR için İstem Kılavuzu

Çeşitli belge işleme görevleri için DeepSeek-OCR'yi etkili bir şekilde kullanma sanatında ustalaşın

Etkili OCR için Temel Unsurlar

Görüntü Kalitesi

Optimum metin tanıma için görüntülerin net, iyi aydınlatılmış ve yeterli çözünürlüğe (minimum 300 DPI önerilir) sahip olduğundan emin olun.

Example: Metin ve arka plan arasında iyi kontrast bulunan yüksek çözünürlüklü taramalar veya fotoğraflar yükleyin.

Belge Türü Belirtimi

Modelin tanıma kalıplarını optimize etmesine yardımcı olmak için işlediğiniz belge türünü belirtin.

Example: Fatura, akademik makale, el yazısı notları veya tablolar içeren formlar işleyip işlemediğinizi belirtin.

Dil Bağlamı

Model dilleri otomatik olarak algılarken, birincil dili belirtmek, karma dil belgeleri için doğruluğu artırabilir.

Example: Daha iyi sonuçlar için 'İngilizce ve Çince karışık belge' veya 'Arapça teknik kılavuz' belirtin.

Çıktı Biçimi Tercihi

Tercih ettiğiniz çıktı biçimini tanımlayın - düz metin, korunan biçimlendirmeye sahip Markdown veya yapılandırılmış veri çıkarma.

Example: 'Korunan tablo yapısına sahip Markdown biçimi' veya 'Yalnızca vurgulanan bölümlerden metin çıkar' isteyin.

Profesyonel İpuçları

Verimlilik için Toplu İşleme

A100-40G GPU'da ~2.500 jeton/sn'lik optimum verim elde etmek için büyük belge kümeleri için vLLM toplu işlemeyi kullanın.

El Yazısı Metin için Ön İşleme

El yazısı belgeler için yeterli aydınlatma ve kontrast sağlayın. Düz hizalama, tanıma doğruluğunu %92'nin üzerine çıkarır.

Gelişmiş Özelliklerden Yararlanın

Karmaşık görsel öğeler içeren bilimsel makaleler ve teknik belgeler için grafik ayrıştırma ve formül tanıma yeteneklerini kullanın.

Hassas Veriler için Kendi Kendine Barındırma

Gizli belgeleri işlerken maksimum gizlilik ve kontrol için kendi altyapınızda dağıtın.

Temel ve Gelişmiş OCR Kullanımı Karşılaştırması

Temel OCR

"Görüntü yükle → Metin çıkar → Düz metin çıktısı"

DeepSeek ile Gelişmiş OCR

"Görüntü yükle → Belge türünü belirt → Yapı korumayı etkinleştir → Tablolar, formüller ve biçimlendirme bozulmadan Markdown alın"

Tek Dil

"Yalnızca İngilizce belgeleri işle"

Çok Dilli İşleme

"Otomatik algılama ve karma dil desteği ile aynı anda 100'den fazla dildeki belgeleri işle"

Yalnızca Metin

"Basit belgelerden düz metin çıkar"

Kapsamlı Analiz

"Metin çıkarın, grafikleri ayrıştırın, formülleri tanıyın, geometrik şekilleri anlayın ve eksiksiz belge yapısını koruyun"

DeepSeek-OCR Nasıl Kullanılır

İhtiyaçlarınıza göre uyarlanmış birden çok dağıtım seçeneğiyle DeepSeek-OCR'yi kullanmaya başlayın.

1

Dağıtım Yönteminizi Seçin

Hız, ölçek ve gizlilik gereksinimlerinize göre çevrimiçi araç, Python API, vLLM toplu işleme veya kendi kendine barındırılan dağıtım arasından seçim yapın.

2

Belgenizi Yükleyin

Web arayüzü veya API aracılığıyla resimleri veya PDF dosyalarını yükleyin. Desteklenen biçimler arasında JPG, PNG, TIFF ve çok sayfalı PDF bulunur.

3

İşleme Seçeneklerini Yapılandırın

Belge türünü, dil tercihlerini ve çıktı biçimini belirtin. Gerekirse grafik ayrıştırma veya formül tanıma gibi gelişmiş özellikleri etkinleştirin.

4

İşle ve İncele

Belgenizi işlenmek üzere gönderin. Model, korunan yapı, biçimlendirme ile metni çıkaracak ve karmaşık öğeleri otomatik olarak işleyecektir.

5

Sonuçları Dışa Aktar veya Entegre Et

Çıkarılan metni tercih ettiğiniz biçimde indirin veya otomatik işleme hatları için API aracılığıyla doğrudan iş akışınıza entegre edin.

En İyi Uygulamalar

  • En iyi doğruluk için yüksek çözünürlüklü görüntüler (300 DPI veya daha yüksek) kullanın
  • Büyük belge kümeleri için maksimum verim elde etmek için vLLM toplu işlemeyi kullanın
  • Biçimlendirilmiş belgeler, tablolar veya akademik makalelerle çalışırken yapı korumayı etkinleştirin
  • Hassas veya gizli belgeleri işlemek için kendi kendine barındırılan dağıtımı düşünün
  • Belirli kullanım durumunuz için ayarları optimize etmek için önce örnek belgelerle test edin

DeepSeek-OCR 100'den fazla dili destekler ve karmaşık düzenlere, formüllere ve grafiklere sahip belgeleri işler. Üretim iş yükleri için optimum performans için Python API'sini veya vLLM toplu işlemeyi kullanmayı düşünün.

FAQ

Sıkça Sorulan Sorular

DeepSeek-OCR hakkında sık sorulan sorular ve modelden en iyi şekilde nasıl yararlanılacağı.

Belge İşleme Sürecinizi Dönüştürmeye Hazır mısınız?

DeepSeek-OCR'nin 100'den fazla dil, grafik ayrıştırma ve karmaşık düzen anlayışı desteğiyle gelişmiş optik karakter tanıma gücünü deneyimleyin.

MIT Lisansı altında kullanılabilen açık kaynaklı model. Maksimum gizlilik ve kontrol için çevrimiçi dağıtın veya kendi kendinize barındırın.