Skip to content

Instantly share code, notes, and snippets.

@tamvodopad
Created February 6, 2026 17:11
Show Gist options
  • Select an option

  • Save tamvodopad/6f7e4bc4a8e07e5c4dde9a0bb0c41599 to your computer and use it in GitHub Desktop.

Select an option

Save tamvodopad/6f7e4bc4a8e07e5c4dde9a0bb0c41599 to your computer and use it in GitHub Desktop.
Промт для расшифровки метрической книги кодинг агентом

Задача: Транскрипция метрической книги в Excel

Контекст

В папке [ПУТЬ_К_ПАПКЕ] находятся JPG-файлы — сканы страниц метрической книги православной церкви (Часть первая: О родившихся). Текст — дореволюционная русская орфография, рукописный.

Что нужно сделать

  1. Прочитай SKILL.md для создания xlsx-файлов
  2. Просканируй папку, отсортируй файлы по имени (это порядок страниц)
  3. Для каждого JPG: открой изображение, транскрибируй все записи
  4. Собери всё в единый Excel-файл

Правила транскрипции

Орфография

  • Сохраняй дореволюционное написание как есть: ѣ, і, ъ, ѳ, ѵ
  • Сохраняй оригинальные заглавные буквы и пунктуацию
  • НЕ модернизируй текст

Структура таблицы Excel — 10 столбцов:

Столбец Содержание
A: Файл Имя JPG-файла (для обратной привязки к скану)
B: № м/ж Порядковый номер рождения (муж/жен)
C: Дата рождения Как в документе
D: Дата крещения Как в документе
E: Имя Имя младенца
F: Родители Полная запись — сословие, звание, имя отца и матери
G: Восприемники Крёстные родители — полностью как записано
H: Кто совершалъ таинство Священник И псаломщик (даже если подпись псаломщика визуально правее)
I: Подписи свидетелей Только мирские подписи (рукоприкладство), если есть
J: Примечания Любые пометки, надписи на полях, номера страниц

Обработка сложных случаев

  • Пустая ячейка → оставить пустой
  • Неразборчивый текст → [неразборчиво]
  • Частично читаемый → [неуверенно: текст]
  • Повторы (то же, " ", тогоже села) → раскрыть полностью, подставив реальное значение из предыдущей записи
  • Вертикальный текст месяца → записать в "Примечания" первой записи этого месяца: "Начало месяца: [Месяц]"
  • Итоговые строки ("Итого мужеска... женска...") → отдельная строка, текст в столбце "Примечания"

Формат Excel-файла

  • Имя файла: metrical_book_transcription.xlsx
  • Лист 1: "Записи" — все транскрибированные данные
  • Лист 2: "Статистика" — краткая сводка: всего записей, по месяцам, м/ж, количество нечитаемых фрагментов
  • Первая строка — заголовки, закреплена
  • Ширина столбцов — автоподбор
  • Столбцы F, G, H — ширина минимум 40 символов (там длинный текст)

Порядок работы

  • Обрабатывай файлы по одному
  • После каждых 5 файлов выводи краткий прогресс: сколько обработано, сколько записей найдено
  • Если на странице нет табличных записей (обложка, титул, пустая страница) — пропусти, отметь в примечаниях
  • В конце сохрани файл и покажи итоговую статистику
Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment