|
kukuy999
Стаж: 16 лет Сообщений: 178
|
kukuy999 ·
14-Окт-10 22:58
(14 лет 1 месяц назад)
Извините, если баян, но вроде не нашел подобного топика.
Не знаю, как у других, но у меня регулярно возникает необходимость конвертировать иностранные сабы формата idx-sub в формат srt для того, чтобы потом переводить их на русский язык. Наиболее распространенные способы конвертации, о которых много написано на видеосайтах, подразумевают использование для этой цели либо утилиты subresync из VobSub, либо программы SubRip. Но лично у меня, к сожалению, subresync вообще не запускается, а при использовании SubRip'а зачастую возникают траблы, когда он просто не распознает сабы по той или иной причине.
Но, к счастью, я нашел для себя практически универсальный способ, который пока что меня не подводил ни разу - тьфу-тьфу-тьфу!
Для него понадобятся две утилиты:
SubToSup - http://www.videohelp.com/tools/SubToSup
DVDSubEdit - http://www.videohelp.com/tools/DVDSubEdit
Итак,
1. Запускаем SubToSup, кликаем на [...] или File/Open
Выбираем нужную папку, в которой лежат файлы idx и sub, кликаем на idx-файл, а затем на Open.
2. Как только вы загрузили файл, почти сразу выскочит окошко, в котором надо нажать на OK.
А в папке, где лежать файлы idx и sub, появится файл с расширением sup.
3. Запускаем программу DVDSubEdit. И либо перетаскиваем файл с расширением sup в окно программы, либо в меню File выбираем опцию Open .SUP file.
При этом появится окошко с требованием загрузить ifo-файл, просто жмем на Cancel и продолжаем работу дальше.
4. Обращаем внимание на нижний правый уго программы - там находится кнопочка Run OCR.
Жмем на нее, появляется окошко Running OCR..., демонстрирующее процесс распознавания sup-файла.
Когда процесс закончится - окошко исчезнет и в том же углу активируется кнопка Save as .srt
Теперь вы можете сохранить распознанный файл субтитров в формате srt.
Думаю, что не нужно уточнять, что желательно, чтобы файл субтитров имел то же название, что и фильм, к которому он относится.
Собственно, все. Степень распознавания встроенного в DVDSubEdit распознавальщика (OCR) высокая, однако пройтись потом по файлу и исправить ошибки все равно придется.
Оригинал статьи находится тут: http://forum.videohelp.com/threads/281310-How-to-convert-IDx-Sub-to-Srt-w-o-typing-a-manuscript
|
|
germanm2000
Стаж: 16 лет 5 месяцев Сообщений: 1380
|
germanm2000 ·
15-Окт-10 13:27
(спустя 14 часов)
kukuy999
Способ хороший и быстрый, а зачастую единственно возможный (я тоже упоминал о нем как-то), но имеет недостаток в части распознавания.
kukuy999 писал(а):
Степень распознавания встроенного в DVDSubEdit распознавальщика (OCR) высокая,
К сожалению, GOSR в DVDSubEdit более-менее прилично обрабатывает только английские сабы, хотя и в них иногда делает много ошибок (напр., в знаках препинания).
Другие субтитры, содержащие надстрочные знаки (французские, итальянские, немецкие и т.д.) ему не по зубам, не говоря уж про кириллицу.
|
|
GarfieldX
Стаж: 19 лет 9 месяцев Сообщений: 4016
|
GarfieldX ·
15-Окт-10 15:20
(спустя 1 час 52 мин.)
kukuy999 писал(а):
а при использовании SubRip'а зачастую возникают траблы, когда он просто не распознает сабы по той или иной причине
Со скольких ДВДшек снимал сабы, раз или два были проблемы.
Зато распознавание там куда лучше чем у DVDSubEdit.
|
|
germanm2000
Стаж: 16 лет 5 месяцев Сообщений: 1380
|
germanm2000 ·
15-Окт-10 16:57
(спустя 1 час 37 мин.)
GarfieldX
Имелись в виду траблы с распознаванием голых idx/sub в SubRip. Вы ведь в теме Проблема с распознаванием idx+sub в SubRip тоже немного участвовали.
А с нормальными DVD, базара нет, распознавание SubRip-ом качественнее.
|
|
miha4406
Стаж: 14 лет 6 месяцев Сообщений: 73
|
miha4406 ·
22-Окт-10 19:46
(спустя 7 дней)
А это норм, что он мне в выходном srt выдаёт что-то типа:
Цитата:
1
00:00:03,299 --> 00:00:03,299
$MnbM XAPYXM CY_3YMMM 2
00:00:03,859 --> 00:00:03,859
Mu-Mucmu_ecKoff MuKypyH-pyH!
4o-4opy0woff MuKypyH-pyH!
???
хотя в окне программы всё норм отображается...
|
|
germanm2000
Стаж: 16 лет 5 месяцев Сообщений: 1380
|
germanm2000 ·
22-Окт-10 20:32
(спустя 45 мин., ред. 22-Окт-10 20:32)
miha4406
Ага, для кириллицы - в самый раз. А че Вы хотели?
"В окне программы" - графическое изображение сабов. Результат распознавания - в масеньком окошке справа внизу (OCR).
|
|
miha4406
Стаж: 14 лет 6 месяцев Сообщений: 73
|
miha4406 ·
27-Ноя-10 14:01
(спустя 1 месяц 4 дня)
А русских(или понимающих кириллицу) аналогов нет?
|
|
MMMXXX_2
Стаж: 15 лет 10 месяцев Сообщений: 78
|
MMMXXX_2 ·
27-Ноя-10 20:21
(спустя 6 часов, ред. 27-Ноя-10 20:21)
miha4406
Попробуй ещё Subresync. там тоже можно открыть idx / sub, а потом выбрать сохранить как srt, что запустит распознавание. С русским языком там проблем нет.
ЗЫ Вот иероглифы распознают хреново, что Subresync, что DVDSubEdit, там мне приходилось сохранять каждый титр, как графику, а потом распознавать в eTypist.
|
|
Обер-лейтенант Клосс
Стаж: 15 лет 6 месяцев Сообщений: 62
|
Обер-лейтенант Клосс ·
14-Фев-11 17:29
(спустя 2 месяца 16 дней)
kukuy999
Спасибо большое. Только с вашими двумя утилитами я смог конвертировать субтитры из .sub и .idx
в .srt.
|
|
Арина_Ковак
Стаж: 14 лет 6 месяцев Сообщений: 1
|
Арина_Ковак ·
17-Мар-11 19:52
(спустя 1 месяц 3 дня)
|
|
popytka
Стаж: 14 лет 6 месяцев Сообщений: 4
|
popytka ·
26-Мар-11 15:57
(спустя 8 дней)
Спасибо большое
Попались какие-то суровые сабы, только ваш способ и сработал
|
|
Lion Smith
Стаж: 19 лет 7 месяцев Сообщений: 567
|
Lion Smith ·
25-Апр-11 10:36
(спустя 29 дней, ред. 25-Апр-11 10:36)
Привет всем. Хотел бы обратить ваше внимание на одну программу.
Subtitle Edit 3.1
Домашняя страничка автора http://www.nikse.dk/
Ссылка на скачивание http://code.google.com/p/subtitleedit/downloads/list
Есть и портабл и сорс. Если кому покажется минусом нету русского языка.
Мне лично очень помогла с ДВД вроде этого https://rutr.life/forum/viewtopic.php?t=3114927 в котором сабы в ужасном состоянии начиная с качества , словами на других языках и заканчивая словами которых нет ни в одном словаре .Работая со всеми выше перечисленными программами замучился.В этой проблемы возникли только с отметками мелодий, хотя в настройке есть замена музыкальных ключей на другие символы. Наверное что-то не понял
Удачи
Несколько скринов
|
|
angelica_k
Стаж: 15 лет 6 месяцев Сообщений: 1028
|
angelica_k ·
22-Сен-11 23:19
(спустя 4 месяца 27 дней)
Вообще то IdxSub2Srt из комплекта AviAddXSub очень хорошо справляется и с английскими и русскими субтитрами.
|
|
krutoy uoker
Стаж: 14 лет 10 месяцев Сообщений: 160
|
krutoy uoker ·
24-Ноя-11 19:06
(спустя 2 месяца 1 день)
Люди, а можно я всем скажу большое человеческое спасибо. я целый день билась, пытаясь переконвертировать драгоценные для меня сабы... от моих психов семья морально пострадала, лишенная обеда, ужина и материнского тепла. и вдруг....
короче - по полной сенькаю!!!
|
|
mashapeterc
Стаж: 14 лет 6 месяцев Сообщений: 25
|
mashapeterc ·
11-Дек-11 14:28
(спустя 16 дней)
kukuy999, большое спасибо
|
|
Max Nabokov
Стаж: 14 лет 10 месяцев Сообщений: 475
|
Max Nabokov ·
04-Фев-12 20:59
(спустя 1 месяц 24 дня)
IdxSub2Srt - это геморрой какой-то, а это класс!!! быстро и просто. не все буквы правда распознала, но не много, я их поправил в ручную.
kukuy999 - Вы большой молодец! огромное Вам спасибо!
|
|
grabomir
Стаж: 16 лет 6 месяцев Сообщений: 203
|
grabomir ·
23-Апр-12 18:12
(спустя 2 месяца 18 дней)
А эта программа только английский язык понимает? Какой-нибудь норвежский никак? Прогоняю через OCR - ничего, и выходит пустой файл.
|
|
germanm2000
Стаж: 16 лет 5 месяцев Сообщений: 1380
|
germanm2000 ·
23-Апр-12 18:47
(спустя 35 мин., ред. 23-Апр-12 18:47)
grabomir писал(а):
А эта программа...
Какая, DVDSubEdit?
В норвежском алфавите 3 буквы (æ, ø, å) имеют начертание, отличное от английского, поэтому только они распознаются неправильно и будут заменены какими-либо символами. А с остальными буквами никаких проблем быть не должно.
|
|
grabomir
Стаж: 16 лет 6 месяцев Сообщений: 203
|
grabomir ·
23-Апр-12 19:10
(спустя 22 мин.)
germanm2000 Я про DVDSubEdit. Пробую - выходит пустой текст.
|
|
germanm2000
Стаж: 16 лет 5 месяцев Сообщений: 1380
|
germanm2000 ·
23-Апр-12 19:24
(спустя 14 мин.)
grabomir
Ну, не знаю. Сабы посмотреть не дадите?
|
|
grabomir
Стаж: 16 лет 6 месяцев Сообщений: 203
|
grabomir ·
24-Апр-12 18:39
(спустя 23 часа)
|
|
germanm2000
Стаж: 16 лет 5 месяцев Сообщений: 1380
|
germanm2000 ·
24-Апр-12 19:26
(спустя 46 мин., ред. 24-Апр-12 19:52)
grabomir
Получил Ваши сабы. Действительно, приведенным в данной теме способом ничего сделать не получается. SUP'ов, полученых в результате конвертации из IDX/SUB, DVDSubEdit не видит вообще, а потому и распознавать ему там нечего. Зато с этой бедой справится замечательная прожка IdxSub2Srt.
Порядок действий:
- Запускаете IdxSub2Srt.
- Затем выбираете нужный язык, в вашем случае - Norwegian (no).
- Загружаете свой IDX/SUB.
- Выбираете цвет, в вашем случае можно 1 или 1&2.
- И затем постепенно вводите буковки ручками.
Короче, вот подробная инструкция. Уверен, Вы справитесь.
p.s. Небольшая загвоздочка. Внутри ваших сабов 3 потока (английский и 2 норвежских). По всей видимости нужен второй норвежский поток. Как его выбрать в IdxSub2Srt, точно не знаю, но появилась идея.
идея
Открываем Блокнотом idx-файл и изменяем идентификатор первого норвежского потока русским, например.
Т.е. было:
Код:
# NORWEGIAN
id: no, index: 1
а будет:
Код:
# NORWEGIAN
id: ru, index: 1
В таком случае при выборе норвежского будет подхватываться именно 2 поток.
Надеюсь, я объяснил понятно.
|
|
grabomir
Стаж: 16 лет 6 месяцев Сообщений: 203
|
grabomir ·
24-Апр-12 19:52
(спустя 26 мин., ред. 24-Апр-12 19:52)
germanm2000 Спасибо за добрый совет, но...
Сделал всё по Вашей инструкции, открыл файл, а там ВСЕ буквы "неизвестные".
Это то же самое, что текст в Ворде заново набирать. УДП: впрочем, не стоит Вам мучиться. Нашёл субтитры в нужном формате, так что вопрос снят. Но тем не менее, спасибо за помощь!
|
|
germanm2000
Стаж: 16 лет 5 месяцев Сообщений: 1380
|
germanm2000 ·
24-Апр-12 20:14
(спустя 22 мин.)
Ну и ладно. Нашли, так нашли.
grabomir писал(а):
Сделал всё по Вашей инструкции, открыл файл, а там ВСЕ буквы "неизвестные".
Это то же самое, что текст в Ворде заново набирать.
Совсем не то же самое. Вы заблуждаетесь.
|
|
Fluxice
Стаж: 15 лет 9 месяцев Сообщений: 47
|
Fluxice ·
25-Апр-12 07:04
(спустя 10 часов)
Обращаюсь ко всем, кто разбирается в форматах файлов субтитр!
Нужна помощь в определении формата неизвестного файла субтитр. (Готовлю раздачу диска Silent Hill Experience для просмотра на ПК.)
Заголовок файла (Header) / HEX:
Есть подозрения, что эти субтитры - какой-то raw формат, откуда потом берутся sub/idx, но я не знаю как это проверить.
В HEX представлении видна структура файла. Если присмотреться внимательно, то очевидно, что это просто скопление PNG файлов. Эти файлы действительно можно выдрать любым риппером. "‰PNG" - это заголовок PNG изображений. Если присмотреться, между изображениями (это видно даже в заголовке) есть какая-то служебная информация. Очевидно, это указатели на фреймы видеоряда. Но вот какая утилита способна преобразовать всё это богатство в те же sub/idx? Писать собственный код с нуля у меня нет желания, но буду благодарен за ссылку на сорс, который нужно просто доработать напильником к данному случаю.
Ссылка на архив с файлами одних и тех же субтитров, но на пяти языках...
Эти субтитры выдраны из одного видеофайла UMD диска Silent Hill Experience. Запрятаны они там были хорошо, выдрать их можно только низкоуровневым MPG-демуксом.
Есть неподтверждённая информация, что эти субтитры может выдирать линуксовская тулза tcextract с параметром "-x ps1". В комментариях к утилите написано: "ps1 - MPEG private stream (subtitles)". Но, так как линукса у меня нету, а ставить сейчас убунту только ради проверки теории мне не куда, то просьба к линуксоидам - проверьте, пожалуйста это дело как-нибудь. И преобразует ли программа эти субтитры во что-нибудь, или просто выдирает? Выдрать-то я и сам могу.
P.S. Если кому-то интересно, то релиз Silent Hill Experience для ПК сейчас упирается только в отсутствие субтитров. Если мне удастся получить все субтитры с корректными таймкодами, то я переведу их на русский. Самое сложное уже позади: я смог записать раскодированный звук UMD диска! Теперь осталось только синхронизировать дорожки в видеофайлах. Для финального релиза я выбрал MKV контейнер. Видео оставляю родное (ID 224 (0xE0), AVC). Хочу создать как можно более качественную раздачу.
|
|
angelica_k
Стаж: 15 лет 6 месяцев Сообщений: 1028
|
angelica_k ·
05-Май-12 19:19
(спустя 10 дней, ред. 05-Май-12 19:19)
Русский язык уже есть!
Subtitle Edit наконец-то обзавелся русским модулем для Tesseract 3 и русскими словарями проверки орфографии. Подробнее здесь
Распознала с помощью неё субтитры с которыми не справлялась IdxSub2Srt (плохая графика в sub, каждый символ, даже в пределах одного предложения предлагалось определять по новой).
|
|
alex-kin
Стаж: 14 лет 8 месяцев Сообщений: 384
|
alex-kin ·
30-Май-12 17:34
(спустя 24 дня)
Уважаемые друзья!
А можно ли распознать файл, если файл .sub присутствует, а файл .idx - отсутствует?
Помогите, пожалуйста!
|
|
germanm2000
Стаж: 16 лет 5 месяцев Сообщений: 1380
|
germanm2000 ·
30-Май-12 18:11
(спустя 36 мин.)
alex-kin
Уверены, что это графический sub из комплекта idx/sub? Возможно, он текстовый. Не пробовали открыть его в Subtitle Workshop?
|
|
alex-kin
Стаж: 14 лет 8 месяцев Сообщений: 384
|
alex-kin ·
30-Май-12 18:51
(спустя 39 мин., ред. 30-Май-12 18:51)
germanm2000, к сожалению Subtitle Workshop пишет про "неподдерживаемый формат". Я делал такую штуку - брал .idx от другого файла и переименовывал. SubResync эту "пару" подхватывал и можно было распознавать - но не все реплики и, конечно же, со сбитым таймингом. Забавно, что MKVextractGUI его именно как .idx воспринимает... Но .idx размера под 4-5 Мб:)
|
|
germanm2000
Стаж: 16 лет 5 месяцев Сообщений: 1380
|
germanm2000 ·
30-Май-12 19:43
(спустя 52 мин., ред. 30-Май-12 19:43)
alex-kin
Понятно. Стало быть, беда.
Есть еще такой интересный момент. Попадались IDX/SUB, содержащие несколько потоков субтитров на разных языках. В файле IDX были указаны эти языки и соответствующие им тайминги. Любопытно, что было бы, если конвертировать такие IDX/SUB предложенным здесь способом в SUP. Жаль, не попробовал, когда они были под рукой.
|
|
|