Я знатный слоупок. Иногда я делаю такие дела, которые надо было бы сделать десятилетие назад. Но с другой стороны, не просто так существует поговорка "Лучше поздно, чем никогда". И я ее придерживаюсь.
Итак, что произошло на этот раз, и при чем тут нейросети? Дело в том, что в моих загажниках отложенных разработок была такая, которую я, неожиданно для себя, решил за один день. Суть такова. В экосистеме менеджера накомпления информации MyTetra некоторое время существовало большое количество баз знаний. Базы хранились сторонними пользователями на GitHub. Однако, были такие пользователи, которые некоторое время вели свои базы, а потом удаляли аккаунт на GitHub. Или удаляли репозитарий. Или переводили репозитарий в закрытое состояние. А я на тот момент не понимал истинной ценности этих баз, и мне в голову не приходило методично сделать личные форки на все существующие базы знаний. Поэтому базы исчезали, а восстановить их было неоткуда. И только после потери с полдесятка баз, я нашел время, пробежался по всем существующим базам и сделал форки.
Но на периферии сознания у меня была мысля, что не все потеряно: в конце концов, у меня в кеше MyTetra Share аккуратно лежали самые свежие копии индексных файлов mytetra.xml. А сами записи были по нескольку раз обработаны краулером Web.Archive.Org. Так почему бы не написать на коленке скрипт, который бы из всех этих данных не составил готовую базу знаний в формате MyTetra?
Дело тормозилось тем, что я давно уже не трогал ни язык PHP, ни древнючий фреймверк CodeIgniter. И я очень устал после разработки отслеживателя новых записей. И снова погружаться в эти дебри не хотелось. Но! Так получилось, что я более полугода вовсю пользуюсь нейросеткой ChatGPT, а с некоторых пор и Yandex GPT, когда за сутки заканчиваются бесплатные токены на поделие OpenAI. И я подумал: попробую написать скрипт, не особо вдаваясь в детали реализации. Какой получится, такой и получится. Мне главное результат. Все равно, он будет применен в единичных случаях.
И таки да, скрипт был написан, причем буквально за несколько часов появился рабочий вариант, который сделал то что нужно. То, до чего у меня не доходили руки, вдруг было реализовано легко и просто с помощью нейросетей.
И вот результат: восстановленная база знаний товарища Harpokrat.
Да, это пробная база, она состоит всего из 20 страниц. Но я рад, что данные были восстановлены и снова отображаются в интерфейсе MyTetra Share.