HELP

Операционная система Debian, работа в терминале от обычного пользователя.
Можно повторить на ПК или сервере с линуксом (даже без графической подсистемы).
На других ОС не проверял, но думаю тоже возможно.

Я, традиционно в подобных случаях, работаю от юзера pupkin.
Далее везде, где требуется использовать имя пользователя linux или
пользователя postgres, а также имя рабочей папки linux или имя рабочей
базы данных, я везде буду употреблять это имя, пароль везде я пишу 1q2w3e.

Вы при первом прогоне этого проекта, можете так и оставить, чтобы не
запутаться, но в рабочем проекте, тем более в продакшн, всё должно быть
по взрослому - выбирайте длинные, сложные логины и пароли, и не забывайте
их менять везде в своих скриптах и в базах.

    Виртуальная среда Python

deactivate  # перед созданием новой, старую, если она активна, нужно дективировать
python3 -m venv env15  # создать виртуальную среду с именем env15
source env15/bin/activate  # активировать новую виртуальную среду
python3 -m pip install --upgrade pip  # обновить систему загрузку модулей pip

Установка модулей из requirements.txt
pip install -r ~/mypy/7_requirements.txt  # для работы без использования nvidia
pip install -r ~/mypy/all_requirements.txt  # для работы с использованием nvidia


    Подготовка таблиц atrain и atest

Если вы пропустили страницу HELP пункта 305 и не выполнили то, что там написано,
сделайте это сейчас, иначе дальше двигаться не получится.

-- Посмотрите состав и размер таблиц (количество записей, т.е. строк)
select * from f_table_size();

-- Посмотрите код функции, чтобы понять как ее использовать.
-- В начале кода есть подробный комментарий.
\sf f_create_train_test

-- Выполните запрос, чтобы создать (или пересоздать)
-- таблицы atrain и atest. Они нужны для тренировки (обучения)
-- и тестирования модели.
select * from f_create_train_test(
  round(428466 * 0.2 * 0.8)::int,
  round(428466 * 0.2 * 0.2)::int);
-- здесь вместо выражений во внешних скобках, можно поставить
-- числа посчитанные в уме согласно принятой для этого схеме:
-- от общего числа записей в основной таблице взять 20%,
-- полученное значение разделить так: для обучения 80%,
-- для тестирования 20%.
-- Большая точность при этом не требуется.

-- Ещё раз посмотрите размеры таблиц
select * from f_table_size();
-- Если картина близка к этой - всё в порядке:
ЗАМЕЧАНИЕ:  Всего:  514182
 tablename  |  size
------------+--------
 articles   | 428466
 atest      |  17139
 athemes    |     11
 atrain     |  68555
 doctype    |      4
 publishers |      7
(6 строк)