2026-rff_mp/stepinim/lab1_structure/test.py

376 lines
13 KiB
Python
Raw Normal View History

2026-04-28 18:25:45 +00:00
import sys
2026-05-21 10:40:02 +00:00
sys.setrecursionlimit(30000) # Увеличиваю лимит рекурсии для BST
2026-04-28 18:25:45 +00:00
2026-05-21 10:40:02 +00:00
# Связный список
2026-04-28 18:25:45 +00:00
def ll_insert(head, name, phone):
2026-05-21 10:40:02 +00:00
new_node = {'name': name, 'phone': phone, 'next': None} # Создаю новый узел
if head is None: # Если список пуст
return new_node # Возвращаю узел как голову
curr = head # Указатель для обхода
prev = None # Храню предыдущий узел
while curr is not None: # Иду по списку
if curr['name'] == name: # Если нашел такое же имя
curr['phone'] = phone # Обновляю телефон
2026-04-28 18:25:45 +00:00
return head
prev = curr
curr = curr['next']
2026-05-21 10:40:02 +00:00
prev['next'] = new_node # Добавляю в конец
2026-04-28 18:25:45 +00:00
return head
2026-05-21 10:40:02 +00:00
2026-04-28 18:25:45 +00:00
def ll_find(head, name):
2026-05-21 10:40:02 +00:00
curr = head # Начинаю с головы
while curr: # Иду по всему списку
if curr['name'] == name: # Сравниваю имена
return curr['phone'] # Возвращаю телефон
curr = curr['next'] # Перехожу к следующему
return None # Не нашел
2026-04-28 18:25:45 +00:00
def ll_delete(head, name):
2026-05-21 10:40:02 +00:00
if head is None: # Пустой список
2026-04-28 18:25:45 +00:00
return None
2026-05-21 10:40:02 +00:00
if head['name'] == name: # Удаляю голову
return head['next'] # Возвращаю второй элемент
2026-04-28 18:25:45 +00:00
curr = head
2026-05-21 10:40:02 +00:00
while curr['next']: # Иду пока есть следующий
if curr['next']['name'] == name: # Нашел элемент для удаления
curr['next'] = curr['next']['next'] # Перепрыгиваю через него
2026-04-28 18:25:45 +00:00
return head
curr = curr['next']
return head
2026-05-21 10:40:02 +00:00
2026-04-28 18:25:45 +00:00
def ll_list_all(head):
result = []
curr = head
2026-05-21 10:40:02 +00:00
while curr: # Собираю все элементы
2026-04-28 18:25:45 +00:00
result.append((curr['name'], curr['phone']))
curr = curr['next']
2026-05-21 10:40:02 +00:00
result.sort(key=lambda x: x[0]) # Сортирую по имени
2026-04-28 18:25:45 +00:00
return result
2026-05-21 10:40:02 +00:00
# Хэш-таблица
HASH_SIZE = 1009 # Размер таблицы - простое число
2026-04-28 18:25:45 +00:00
def _hash_name(name):
2026-05-21 10:40:02 +00:00
return hash(name) % HASH_SIZE # Беру остаток от деления - это индекс корзины
2026-04-28 18:25:45 +00:00
def ht_insert(buckets, name, phone):
2026-05-21 10:40:02 +00:00
idx = _hash_name(name) # Вычисляю индекс корзины
buckets[idx] = ll_insert(buckets[idx], name, phone) # Метод цепочек - вставляю в список
2026-04-28 18:25:45 +00:00
def ht_find(buckets, name):
2026-05-21 10:40:02 +00:00
idx = _hash_name(name) # Нахожу корзину
return ll_find(buckets[idx], name) # Ищу в цепочке
2026-04-28 18:25:45 +00:00
def ht_delete(buckets, name):
2026-05-21 10:40:02 +00:00
idx = _hash_name(name) # Нахожу корзину
buckets[idx] = ll_delete(buckets[idx], name) # Удаляю из цепочки
2026-04-28 18:25:45 +00:00
def ht_list_all(buckets):
all_entries = []
2026-05-21 10:40:02 +00:00
for bucket in buckets: # Прохожу по всем корзинам
2026-04-28 18:25:45 +00:00
if bucket is not None:
curr = bucket
2026-05-21 10:40:02 +00:00
while curr: # Собираю всю цепочку
2026-04-28 18:25:45 +00:00
all_entries.append((curr['name'], curr['phone']))
curr = curr['next']
all_entries.sort(key=lambda x: x[0])
return all_entries
2026-05-21 10:40:02 +00:00
# Двоичное дерево поиска
2026-04-28 18:25:45 +00:00
def bst_insert(root, name, phone):
2026-05-21 10:40:02 +00:00
if root is None: # Пустое место - создаю узел
2026-04-28 18:25:45 +00:00
return {'name': name, 'phone': phone, 'left': None, 'right': None}
2026-05-21 10:40:02 +00:00
if name < root['name']: # Меньше - иду влево
root['left'] = bst_insert(root['left'], name, phone) # Рекурсивно вставляю в левое поддерево
elif name > root['name']: # Больше - иду вправо
root['right'] = bst_insert(root['right'], name, phone) # Рекурсивно вставляю в правое поддерево
else: # Равно - обновляю
2026-04-28 18:25:45 +00:00
root['phone'] = phone
return root
2026-05-21 10:40:02 +00:00
2026-04-28 18:25:45 +00:00
def bst_find(root, name):
curr = root
2026-05-21 10:40:02 +00:00
while curr: # Итеративный спуск по дереву
if name == curr['name']: # Нашел
2026-04-28 18:25:45 +00:00
return curr['phone']
2026-05-21 10:40:02 +00:00
elif name < curr['name']: # Искомое меньше - налево
2026-04-28 18:25:45 +00:00
curr = curr['left']
2026-05-21 10:40:02 +00:00
else: # Искомое больше - направо
2026-04-28 18:25:45 +00:00
curr = curr['right']
return None
2026-05-21 10:40:02 +00:00
2026-04-28 18:25:45 +00:00
def bst_delete(root, name):
if root is None:
return None
2026-05-21 10:40:02 +00:00
if name < root['name']: # Ищу в левом поддереве
2026-04-28 18:25:45 +00:00
root['left'] = bst_delete(root['left'], name)
2026-05-21 10:40:02 +00:00
elif name > root['name']: # Ищу в правом поддереве
2026-04-28 18:25:45 +00:00
root['right'] = bst_delete(root['right'], name)
2026-05-21 10:40:02 +00:00
else: # Нашел узел для удаления
if root['left'] is None: # Нет левого ребенка
return root['right'] # Заменяю правым
if root['right'] is None: # Нет правого ребенка
return root['left'] # Заменяю левым
# Есть оба ребенка - ищу минимальный в правом поддереве
2026-04-28 18:25:45 +00:00
min_node = root['right']
2026-05-21 10:40:02 +00:00
while min_node['left']: # Иду до самого левого
2026-04-28 18:25:45 +00:00
min_node = min_node['left']
2026-05-21 10:40:02 +00:00
root['name'] = min_node['name'] # Копирую данные преемника
2026-04-28 18:25:45 +00:00
root['phone'] = min_node['phone']
2026-05-21 10:40:02 +00:00
root['right'] = bst_delete(root['right'], min_node['name']) # Удаляю преемника
2026-04-28 18:25:45 +00:00
return root
2026-05-21 10:40:02 +00:00
2026-04-28 18:25:45 +00:00
def bst_list_all(root):
result = []
2026-05-21 10:40:02 +00:00
def inorder(node): # Симметричный обход
2026-04-28 18:25:45 +00:00
if node:
2026-05-21 10:40:02 +00:00
inorder(node['left']) # Сначала левое
result.append((node['name'], node['phone'])) # Потом корень
inorder(node['right']) # Потом правое
2026-04-28 18:25:45 +00:00
inorder(root)
return result
2026-05-21 10:40:02 +00:00
2026-05-20 12:19:09 +00:00
# ============================================================
# TECT
# ============================================================
import os
2026-04-28 18:25:45 +00:00
import random
2026-05-20 12:19:09 +00:00
import time
import csv
import pandas as pd
import matplotlib.pyplot as plt
# ============================================================
# ПОДГОТОВКА ПАПОК
# ============================================================
DATA_DIR = os.path.join("docs", "data")
os.makedirs(DATA_DIR, exist_ok=True)
csv_path = os.path.join(DATA_DIR, "lab1_results.csv")
graph_path = os.path.join(DATA_DIR, "lab1_graph.png")
# ============================================================
# ТЕСТОВЫЕ ДАННЫЕ
# ============================================================
2026-05-21 10:40:02 +00:00
random.seed(42) # Фиксирую seed для повторяемости
2026-05-20 12:19:09 +00:00
2026-05-21 10:40:02 +00:00
N = 3000 # 3000 записей
2026-05-20 12:19:09 +00:00
base_records = [
(f"User_{i:05d}", f"123-{i:05d}")
for i in range(N)
]
2026-04-28 18:25:45 +00:00
records_shuffled = base_records.copy()
2026-05-21 10:40:02 +00:00
random.shuffle(records_shuffled) # Перемешанный порядок
2026-05-20 12:19:09 +00:00
2026-05-21 10:40:02 +00:00
records_sorted = sorted(base_records, key=lambda x: x[0]) # Отсортированный порядок
2026-04-28 18:25:45 +00:00
2026-05-21 10:40:02 +00:00
# Данные для поиска
2026-05-20 12:19:09 +00:00
search_existing = [
2026-05-21 10:40:02 +00:00
name for name, _ in random.sample(base_records, 100) # 100 существующих имен
2026-05-20 12:19:09 +00:00
]
2026-04-28 18:25:45 +00:00
2026-05-20 12:19:09 +00:00
search_nonexist = [
f"None_{i}"
2026-05-21 10:40:02 +00:00
for i in range(10) # 10 несуществующих имен
2026-05-20 12:19:09 +00:00
]
2026-04-28 18:25:45 +00:00
2026-05-21 10:40:02 +00:00
# Данные для удаления
2026-05-20 12:19:09 +00:00
delete_names = [
2026-05-21 10:40:02 +00:00
name for name, _ in random.sample(base_records, 50) # 50 имен для удаления
2026-05-20 12:19:09 +00:00
]
2026-04-28 18:25:45 +00:00
2026-05-21 10:40:02 +00:00
2026-05-20 12:19:09 +00:00
# ============================================================
# СОЗДАНИЕ СТРУКТУР
# ============================================================
def build_structure(records, struct_type):
if struct_type == "ll":
structure = None
for name, phone in records:
2026-05-21 10:40:02 +00:00
structure = ll_insert(structure, name, phone) # Последовательная вставка
2026-05-20 12:19:09 +00:00
return structure
elif struct_type == "ht":
structure = [None] * HASH_SIZE
for name, phone in records:
2026-05-21 10:40:02 +00:00
ht_insert(structure, name, phone) # Вставка с хэшированием
2026-05-20 12:19:09 +00:00
return structure
elif struct_type == "bst":
structure = None
for name, phone in records:
2026-05-21 10:40:02 +00:00
structure = bst_insert(structure, name, phone) # Вставка с ветвлением
2026-05-20 12:19:09 +00:00
return structure
# ============================================================
# INSERT
# ============================================================
def measure_insert(records, struct_type):
start = time.perf_counter()
2026-05-21 10:40:02 +00:00
build_structure(records, struct_type) # Замеряю время построения структуры
2026-05-20 12:19:09 +00:00
end = time.perf_counter()
return end - start
# ============================================================
# SEARCH
# ============================================================
def measure_search(records, struct_type):
2026-05-21 10:40:02 +00:00
structure = build_structure(records, struct_type) # Строю структуру
2026-05-20 12:19:09 +00:00
start = time.perf_counter()
if struct_type == "ll":
for name in search_existing + search_nonexist:
2026-05-21 10:40:02 +00:00
ll_find(structure, name) # Поиск перебором
2026-05-20 12:19:09 +00:00
elif struct_type == "ht":
for name in search_existing + search_nonexist:
2026-05-21 10:40:02 +00:00
ht_find(structure, name) # Поиск через хэш
2026-05-20 12:19:09 +00:00
elif struct_type == "bst":
for name in search_existing + search_nonexist:
2026-05-21 10:40:02 +00:00
bst_find(structure, name) # Поиск спуском по дереву
2026-05-20 12:19:09 +00:00
end = time.perf_counter()
return end - start
# ============================================================
# DELETE
# ============================================================
def measure_delete(records, struct_type):
2026-05-21 10:40:02 +00:00
structure = build_structure(records, struct_type) # Строю структуру
2026-05-20 12:19:09 +00:00
start = time.perf_counter()
if struct_type == "ll":
for name in delete_names:
2026-05-21 10:40:02 +00:00
structure = ll_delete(structure, name) # Удаление со сдвигом
2026-05-20 12:19:09 +00:00
elif struct_type == "ht":
for name in delete_names:
2026-05-21 10:40:02 +00:00
ht_delete(structure, name) # Удаление из цепочки
2026-05-20 12:19:09 +00:00
elif struct_type == "bst":
for name in delete_names:
2026-05-21 10:40:02 +00:00
structure = bst_delete(structure, name) # Удаление с ребалансировкой
2026-05-20 12:19:09 +00:00
end = time.perf_counter()
return end - start
# ============================================================
# ЗАМЕРЫ
# ============================================================
2026-04-28 18:25:45 +00:00
all_data = []
2026-05-20 12:19:09 +00:00
experiments = [
("LinkedList", "ll"),
("HashTable", "ht"),
("BST", "bst")
]
modes = [
2026-05-21 10:40:02 +00:00
("shuffled", records_shuffled), # Тест на случайных данных
("sorted", records_sorted) # Тест на отсортированных данных
2026-05-20 12:19:09 +00:00
]
for struct_name, struct_type in experiments:
for mode_name, records in modes:
2026-05-21 10:40:02 +00:00
for rep in range(1, 4): # 3 повтора для усреднения
2026-05-20 12:19:09 +00:00
insert_time = measure_insert(records, struct_type)
search_time = measure_search(records, struct_type)
delete_time = measure_delete(records, struct_type)
2026-05-21 10:40:02 +00:00
all_data.append([struct_name, mode_name, rep, "insert", insert_time])
all_data.append([struct_name, mode_name, rep, "search", search_time])
all_data.append([struct_name, mode_name, rep, "delete", delete_time])
2026-05-20 12:19:09 +00:00
# ============================================================
# CSV
# ============================================================
with open(csv_path, "w", newline="", encoding="utf-8") as f:
2026-04-28 18:25:45 +00:00
writer = csv.writer(f)
2026-05-21 10:40:02 +00:00
writer.writerow(["Структура", "Режим", "Повтор", "Операция", "Время (сек)"])
2026-05-20 12:19:09 +00:00
writer.writerows(all_data)
2026-04-28 18:25:45 +00:00
2026-05-20 12:19:09 +00:00
print(f"CSV сохранён: {csv_path}")
2026-04-28 18:25:45 +00:00
2026-05-20 12:19:09 +00:00
# ============================================================
# ГРАФИК
# ============================================================
2026-04-28 18:25:45 +00:00
df = pd.read_csv(csv_path)
2026-05-20 12:19:09 +00:00
df_avg = (
2026-05-21 10:40:02 +00:00
df.groupby(["Структура", "Режим", "Операция"])["Время (сек)"]
2026-05-20 12:19:09 +00:00
.mean()
.reset_index()
)
fig, ax = plt.subplots(figsize=(12, 6))
ops = ["insert", "search", "delete"]
2026-04-28 18:25:45 +00:00
x = range(len(ops))
width = 0.12
2026-05-20 12:19:09 +00:00
configs = [
("LinkedList", "shuffled"),
("LinkedList", "sorted"),
("HashTable", "shuffled"),
("HashTable", "sorted"),
("BST", "shuffled"),
("BST", "sorted")
]
for i, (struct, mode) in enumerate(configs):
subset = df_avg[
2026-05-21 10:40:02 +00:00
(df_avg["Структура"] == struct) &
2026-05-20 12:19:09 +00:00
(df_avg["Режим"] == mode)
2026-05-21 10:40:02 +00:00
]
2026-05-20 12:19:09 +00:00
times = [
2026-05-21 10:40:02 +00:00
subset[subset["Операция"] == op]["Время (сек)"].values[0]
2026-05-20 12:19:09 +00:00
for op in ops
]
ax.bar(
[p + i * width for p in x],
times,
width,
label=f"{struct} ({mode})"
)
ax.set_xticks([p + 2.5 * width for p in x])
2026-04-28 18:25:45 +00:00
ax.set_xticklabels(ops)
2026-05-20 12:19:09 +00:00
ax.set_ylabel("Среднее время (сек)")
ax.set_title("Сравнение структур данных")
2026-05-21 10:40:02 +00:00
ax.legend(bbox_to_anchor=(1.05, 1), loc="upper left")
2026-05-20 12:19:09 +00:00
2026-04-28 18:25:45 +00:00
plt.tight_layout()
2026-05-20 12:19:09 +00:00
plt.savefig(graph_path)
print(f"График сохранён: {graph_path}")
2026-04-28 18:25:45 +00:00
plt.show()