Регулярные выражения

Как, зачем и для чего они нужны в локализации?
Регулярные выражения — специальный язык,
с помощью которого можно легко описать шаблоны текста.

Предположим, что у вас есть текст из 50 предложений. Задача: найти все строки с цифрами.

Конечно, 50 предложений можно просто просмотреть глазами. Но как быть, если текст состоит уже из 250 строк?

Разумный вариант — автоматизация процесса. Для него нужно ввести обычное выражение \d, с помощью которого компьютер поможет вам найти все нужные предложения.

То есть не нужно искать ничего вручную, когда есть автоматизирующий инструмент. С помощью различных выражений в тексте можно найти практически все.
Но появляется вполне логичный вопрос: «А как же я могу это использовать в CAT-инструменте?»

Чаще всего я использую регулярные выражения для того, чтобы спрятать куски кода (теги или переменные), которые встречаются в строках.
Пример регулярки
You bought 2 <font_color_red>new macbooks</font_color_red>.
Представим, что теги такого формата встречаются во всем тексте. Конечно, мы можем просто их скопировать руками. Но согласитесь, что велика вероятность неаккуратной потери символов при переносе <font_color_red> из исходного текста в текст перевода.

Но мы можем эти выражения описать и спрятать в один графический символ. Например, для этого в Memsource при загрузке файла на перевод реализована функция Convert to Memsource tags.
Пример регулярного выражения при загрузке файла
в Memsource.
При загрузке файла нужно это выражение как-то описать. И на помощь приходят регулярки!

И здесь у нас будет работать следующая формула: <[^>]+>

<…> показывают границы описываемого выражения.

^ в квадратных скобках отвечает за anything but, следовательно [^>] говорит «любой знак, кроме >».

+ отвечает за любое кол-во знаков подряд от одного до бесконечности.

Все вместе (<[^>]+>) означает «любой знак, кроме >, повторенный от одного до бесконечности».

Регулярные выражения — нужная, но не всегда простая штука. Я сам до конца не уверен, что понимаю всю структуру описания. Тем не менее учиться этому надо.

Сайты, на которых вы можете больше узнать о регулярных выражениях.
1. regexone.com и regular-expressions.info
На этих сайтах есть весь базис по работе с регулярными выражениями.

2. regex101.com
Здесь вы можете проверить свои выражения. Бот поможет и подскажет, с чем у вас могут быть ошибки при написании регулярки.
Здесь вы можете задать мне любой вопрос
Напишите свой вопрос
Ваш E-mail