Программы для подсчета символов

В этой статье я расскажу, что такое чарлимы, как они работают в CAT-инструменте на примере Memsource,
а также есть ли сторонние программы, которые помогают с подсчетом символов.
Что это
Чарлимы (англ. character limits, рус. ограничение по символам) — это одна из болей переводчиков, которые работают с играми и ПО. Так как не каждый разработчик готов добавить «резиновые» и автоматически адаптирующиеся контейнеры для текста, то нам приходится сокращать фразы.

Основная проблема заключается в длине каждого предложения. Они могут быть разными (а чаще всего так
и происходит). Конечно, современные CAT-инструменты предлагают автоматический подсчет символов в строке, показывая длину как оригинальной, так и переведенной строк.
Например, интерфейс «кошки» Memsource показывает на нижней панели:
1. количество подтвержденных сегментов в файле (Segments: 1/1);
2. количество слов в исходном тексте и переводе во всем файле(Words: 8/8);
3. число символов в исходном тексте и переводе в выбранной строке (48/54).

Кажется, зачем нам еще нужны какие-либо внешние программы? Но есть ситуации, когда стандартные функции не справляются.
На скриншоте выше в предложении появился тег переноса строки. В графе Note (дополнительная информация о строке) написано, что:
1. количество символов в одной строке не может превышать 40 (W-MAX: 40);
2. количество строк в одном сегменте не должно превышать 2 (L-MAX:2).

Memsource не может учитывать теги, поэтому в графе с количеством символов в сегменте он показывает общее количество символов, игнорируя тег. Получается, что для подсчета символов для каждой строки потребуется дополнительное ПО.

Конечно, можно сказать, что все просто считается руками. Можно скопировать каждую часть в Word, проверить там количество символов. Или прибегнуть к Excel, скопировать каждую строку, проверить через =ДЛСТР(). Но вероятность запутаться и наплодить ошибок — крайне высока. К тому же на это уйдет много времени.

Да и представьте ситуацию, когда у вас сегмент, который похож на скриншот внизу. Здесь руками гораздо сложнее посчитать и не запутаться.

Какие есть решения
На данный момент в обход тегов есть вариант копирования в буфера обмен и использование сторонней программы (для Win) и скрипта (для MacOS), но без постоянного переключения между окнами.
Syllabr (для Windows)
Чтобы посчитать символы:
1. откройте программу Syllabr и перейдите на вкладку «Символы»;
2. выделите нужный отрезок сегмента (от тега до тега);
3. результат будет сразу отображен в программе.

Окно Syllabr можно не сворачивать, чтобы постоянно не переключаться между «кошкой» и подсчетом.

Скачать программу

Спасибо Личу и Ибрнаху
Скрипт (для MacOS)
Чтобы посчитать символы:
1. откройте терминал и введите:
ruby -Ku -e 'loop{ x=%x(pbpaste); s="Buffer charlim: %s\n%s" % [x.length, x] ; system "clear"; puts s; sleep 1}';
2. выделите нужный отрезок сегмента (от тега до тега);
3. результат будет отображен в терминале.

Скрипт нужно запустить только один раз — он автоматически будет проверять содержимое буфера.

Спасибо Staenrey и Ales Huzik
Здесь вы можете задать мне любой вопрос
Напишите свой вопрос
Ваш E-mail