Новая OCR модель - DeepSeek OCR 2

Пока все были отвлечены на хайп вокруг Clawdbot, разработчики из Китая выкатили серьезный апгрейд в сфере распознавания текста — DeepSeek OCR 2.

Что изменилось в архитектуре?

Главный сюрприз кроется «под капотом». Привычный модуль CLIP из первой версии неожиданно заменили на LM-style Vision Encoder от Qwen2 (на 500M параметров). Кажется, китайские опенсорс-проекты решили плотнее поддерживать друг друга.

Именно это изменение позволило модели уйти от механического сканирования (строго слева направо…

🔒

Этот материал доступен участникам Клуба. Войдите или оформите доступ, чтобы читать целиком, открывать видео и комментировать.

Войти Вступить / купить доступ