forked from UNN/2026-rff_mp
Подготовка
This commit is contained in:
parent
6b26bf2b0c
commit
6491d3a79e
|
|
@ -1,79 +0,0 @@
|
||||||
def bst_insert(root, name, phone):
|
|
||||||
new_node = {'name': name, 'phone': phone, 'left': None, 'right': None}
|
|
||||||
|
|
||||||
if root is None:
|
|
||||||
return new_node
|
|
||||||
|
|
||||||
current = root
|
|
||||||
while True:
|
|
||||||
if name < current['name']:
|
|
||||||
if current['left'] is None:
|
|
||||||
current['left'] = new_node
|
|
||||||
break
|
|
||||||
else:
|
|
||||||
current = current['left']
|
|
||||||
elif name > current['name']:
|
|
||||||
if current['right'] is None:
|
|
||||||
current['right'] = new_node
|
|
||||||
break
|
|
||||||
else:
|
|
||||||
current = current['right']
|
|
||||||
else:
|
|
||||||
current['phone'] = phone
|
|
||||||
break
|
|
||||||
|
|
||||||
return root
|
|
||||||
|
|
||||||
def bst_find(root, name): #Итеративный поиск в BST
|
|
||||||
current = root
|
|
||||||
while current is not None:
|
|
||||||
if name == current['name']:
|
|
||||||
return current['phone']
|
|
||||||
elif name < current['name']:
|
|
||||||
current = current['left']
|
|
||||||
else:
|
|
||||||
current = current['right']
|
|
||||||
return None
|
|
||||||
|
|
||||||
def bst_find_min(root): #Поиск минимального узла
|
|
||||||
current = root
|
|
||||||
while current['left'] is not None:
|
|
||||||
current = current['left']
|
|
||||||
return current
|
|
||||||
|
|
||||||
def bst_delete(root, name): # Рекурсия только в глубину
|
|
||||||
if root is None:
|
|
||||||
return None
|
|
||||||
|
|
||||||
if name < root['name']:
|
|
||||||
root['left'] = bst_delete(root['left'], name)
|
|
||||||
elif name > root['name']:
|
|
||||||
root['right'] = bst_delete(root['right'], name)
|
|
||||||
else:
|
|
||||||
if root['left'] is None:
|
|
||||||
return root['right']
|
|
||||||
elif root['right'] is None:
|
|
||||||
return root['left']
|
|
||||||
else:
|
|
||||||
min_node = bst_find_min(root['right'])
|
|
||||||
root['name'] = min_node['name']
|
|
||||||
root['phone'] = min_node['phone']
|
|
||||||
root['right'] = bst_delete(root['right'], min_node['name'])
|
|
||||||
return root
|
|
||||||
|
|
||||||
def bst_list_all(root, records=None): #Возвращает отсортированные записи
|
|
||||||
if records is None:
|
|
||||||
records = []
|
|
||||||
|
|
||||||
stack = []
|
|
||||||
current = root
|
|
||||||
|
|
||||||
while stack or current:
|
|
||||||
while current is not None:
|
|
||||||
stack.append(current)
|
|
||||||
current = current['left']
|
|
||||||
current = stack.pop()
|
|
||||||
records.append((current['name'], current['phone']))
|
|
||||||
current = current['right']
|
|
||||||
|
|
||||||
return records
|
|
||||||
|
|
@ -1,3 +0,0 @@
|
||||||
N = 10000 # Количество записей
|
|
||||||
REPEATS = 5 # Количество повторений каждого эксперимента
|
|
||||||
HASH_TABLE_SIZE = 1000 # Размер хеш-таблиц
|
|
||||||
|
|
@ -1,19 +0,0 @@
|
||||||
Структура,Режим,Операция,Повтор1,Повтор2,Повтор3,Повтор4,Повтор5,Среднее,Стд_откл
|
|
||||||
linkedlist,случайный,вставка,6.12412660010159,6.453428599983454,6.0159983998164535,5.846197799779475,6.687424399890006,6.225435159914196,0.3044218200660184
|
|
||||||
linkedlist,случайный,поиск,0.04134450014680624,0.04073229990899563,0.042916799895465374,0.04113580007106066,0.05696159973740578,0.044618199951946734,0.006216087497843716
|
|
||||||
linkedlist,случайный,удаление,0.026781500317156315,0.027109399437904358,0.030823000706732273,0.02719919942319393,0.03118100017309189,0.028618820011615753,0.001954103193777089
|
|
||||||
linkedlist,отсортированный,вставка,6.631766900420189,5.748658500611782,5.798537000082433,6.062226499430835,5.308409399352968,5.909919659979641,0.43462320783889524
|
|
||||||
linkedlist,отсортированный,поиск,0.006313499994575977,0.005670599639415741,0.005590200424194336,0.005645200610160828,0.005786299705505371,0.005801160074770451,0.0002640402924000638
|
|
||||||
linkedlist,отсортированный,удаление,0.0005609998479485512,0.0005288999527692795,0.0005288999527692795,0.0006311992183327675,0.0005285991355776787,0.0005557196214795113,3.9747101397961354e-05
|
|
||||||
hashtable,случайный,вставка,0.4039090992882848,0.43919940013438463,0.5127053996548057,0.4458825998008251,0.5722195003181696,0.47478319983929396,0.06009411868526661
|
|
||||||
hashtable,случайный,поиск,0.0011500995606184006,0.0015127994120121002,0.0014458000659942627,0.0015266994014382362,0.0016105994582176208,0.001449199579656124,0.0001584761558930157
|
|
||||||
hashtable,случайный,удаление,0.0006000008434057236,0.0006478000432252884,0.0006513996049761772,0.0006491998210549355,0.0006536999717354774,0.0006404200568795205,2.0308460750476644e-05
|
|
||||||
hashtable,отсортированный,вставка,0.41475220024585724,0.36477189976722,0.4018732002004981,0.34626630041748285,0.3364391000941396,0.37282054014503957,0.030645843485620654
|
|
||||||
hashtable,отсортированный,поиск,0.00014910008758306503,0.00021160021424293518,0.00014139991253614426,0.00013990048319101334,0.00014150049537420273,0.0001567002385854721,2.763741512756699e-05
|
|
||||||
hashtable,отсортированный,удаление,0.00010520033538341522,0.00011090002954006195,9.95006412267685e-05,9.809993207454681e-05,9.940005838871002e-05,0.0001026201993227005,4.811371049160917e-06
|
|
||||||
bst,случайный,вставка,0.02877839934080839,0.023240000009536743,0.023904399946331978,0.02267790026962757,0.02133959997445345,0.023988059908151626,0.0025394803712577006
|
|
||||||
bst,случайный,поиск,0.00018490012735128403,0.00017419923096895218,0.0001809997484087944,0.0001767994835972786,0.0001687007024884224,0.00017711985856294632,5.569578481417004e-06
|
|
||||||
bst,случайный,удаление,0.00012159999459981918,0.0001150006428360939,0.0001226002350449562,0.00011949986219406128,0.00011199992150068283,0.00011814013123512268,4.0316401567625745e-06
|
|
||||||
bst,отсортированный,вставка,6.140015699900687,7.042814400047064,6.089983900077641,7.145617099478841,7.014688899740577,6.686623999848962,0.46902726732451255
|
|
||||||
bst,отсортированный,поиск,0.0004746001213788986,0.0004603993147611618,0.0005575995892286301,0.0004612002521753311,0.0005747005343437195,0.0005056999623775482,4.9908362408772585e-05
|
|
||||||
bst,отсортированный,удаление,0.0007436992600560188,0.0007255999371409416,0.0007277000695466995,0.0007218997925519943,0.0010781008750200272,0.0007993999868631362,0.00013954953359056988
|
|
||||||
|
Binary file not shown.
|
Before Width: | Height: | Size: 73 KiB |
|
|
@ -1,85 +0,0 @@
|
||||||
# Отчёт по лабораторной работе
|
|
||||||
|
|
||||||
## Цель работы
|
|
||||||
|
|
||||||
Реализовать три структуры данных «с нуля» (связный список, хеш-таблица, двоичное дерево поиска), применить их для хранения записей телефонного справочника и экспериментально сравнить производительность основных операций.
|
|
||||||
|
|
||||||
## Параметры эксперимента
|
|
||||||
|
|
||||||
- Количество записей: 10000
|
|
||||||
- Количество повторов каждого теста: 5
|
|
||||||
- Размер хеш-таблицы: 1000 корзин
|
|
||||||
|
|
||||||
## Результаты экспериментов
|
|
||||||
|
|
||||||
### 1. Связный список
|
|
||||||
|
|
||||||
| Режим | Вставка (сек) | Поиск (сек) | Удаление (сек) |
|
|
||||||
|-------|---------------|-------------|----------------|
|
|
||||||
| Случайный | 6.2254 | 0.0446 | 0.0286 |
|
|
||||||
| Отсортированный | 5.9099 | 0.0058 | 0.0006 |
|
|
||||||
|
|
||||||
### 2. Хеш-таблица
|
|
||||||
|
|
||||||
| Режим | Вставка (сек) | Поиск (сек) | Удаление (сек) |
|
|
||||||
|-------|---------------|-------------|----------------|
|
|
||||||
| Случайный | 0.4748 | 0.0014 | 0.0006 |
|
|
||||||
| Отсортированный | 0.3728 | 0.0002 | 0.0001 |
|
|
||||||
|
|
||||||
### 3. Двоичное дерево поиска (BST)
|
|
||||||
|
|
||||||
| Режим | Вставка (сек) | Поиск (сек) | Удаление (сек) |
|
|
||||||
|-------|---------------|-------------|----------------|
|
|
||||||
| Случайный | 0.0240 | 0.0002 | 0.0001 |
|
|
||||||
| Отсортированный | 6.6866 | 0.0005 | 0.0008 |
|
|
||||||
|
|
||||||
## Анализ результатов
|
|
||||||
|
|
||||||
### 1. Влияние порядка данных на BST
|
|
||||||
При добавлении уже отсортированных элементов BST вырождается в линейную структуру — сложность падает с O(log n) до O(n).
|
|
||||||
Время вставки выросло с 0.0240 до 6.6866 секунд — замедление в 278.7 раза.
|
|
||||||
|
|
||||||
### 2. Почему хеш-таблица не чувствительна к порядку
|
|
||||||
|
|
||||||
Хеш-функция равномерно распределяет ключи по корзинам независимо от их исходного порядка. Поэтому последовательность добавления практически не влияет на производительность.
|
|
||||||
Сравнение случайного и упорядоченного ввода:
|
|
||||||
- Случайный режим: 0.4748 с
|
|
||||||
- Упорядоченный режим: 0.3728 с
|
|
||||||
- Различие: 0.79
|
|
||||||
|
|
||||||
### 3. Почему связный список медленный при поиске
|
|
||||||
|
|
||||||
Поиск в связном списке требует линейного обхода O(n) — структура не поддерживает произвольный доступ. Это делает его непригодным для крупных справочников, где нужен быстрый поиск по ключу.
|
|
||||||
|
|
||||||
Сравнение скорости поиска на случайных данных:
|
|
||||||
- LinkedList: 0.0446 сек
|
|
||||||
- HashTable: 0.0014 сек (преимущество в 30.8)
|
|
||||||
- BST: 0.0002 сек
|
|
||||||
|
|
||||||
### 4. Сравнение удаления
|
|
||||||
|
|
||||||
| Структура | Сложность | Время на 50 удалений (случайные данные) |
|
|
||||||
|-----------|-----------|------------------------------------------|
|
|
||||||
| Связный список | O(n) | 0.0286 сек|
|
|
||||||
| Хеш-таблица | O(1) в среднем | 0.0006 сек |
|
|
||||||
| BST | O(log n) в среднем | 0.0001 сек |
|
|
||||||
|
|
||||||
## Вывод:
|
|
||||||
|
|
||||||
| Задача | Рекомендация | Почему |
|
|
||||||
|--------|-------------|--------|
|
|
||||||
| Частый поиск | Хеш-таблица | O(1) в среднем, не зависит от порядка |
|
|
||||||
| Частые вставки/удаления | Хеш-таблица | Амортизированное O(1) |
|
|
||||||
| Нужен отсортированный вывод | Сбалансированное дерево (AVL/Red-Black) | In-order обход даёт сортировку |
|
|
||||||
| Мало данных (<100 элементов) | Связный список или массив | Простота, накладные расходы не оправданы |
|
|
||||||
| Последовательный доступ (очередь/стек) | Связный список | Вставка/удаление в начало/конец за O(1) |
|
|
||||||
|
|
||||||
## Заключение
|
|
||||||
Проведённый эксперимент подтверждает теоретические оценки сложности:
|
|
||||||
|
|
||||||
1. **Небалансированное BST это плохой выбор** при работе с реальными данными, которые могут оказаться упорядоченными. Деградация до O(n) делает его непригодным для надёжных систем.
|
|
||||||
|
|
||||||
2. **Хеш-таблица показывает стабильные результаты** вне зависимости от порядка входных данных — ключевое преимущество для телефонного справочника с произвольными именами абонентов.
|
|
||||||
|
|
||||||
3. **Связный список — нишевый инструмент**, эффективный только при работе с малыми объёмами данных.
|
|
||||||
|
|
||||||
|
|
@ -1,90 +0,0 @@
|
||||||
import time
|
|
||||||
import numpy as np
|
|
||||||
from linkedlist import ll_insert, ll_find, ll_delete
|
|
||||||
from hashtable import ht_create, ht_insert, ht_find, ht_delete
|
|
||||||
from bst import bst_insert, bst_find, bst_delete
|
|
||||||
|
|
||||||
def measure_insert(records, struct_type, params=None): #Замер времени вставки всех записей
|
|
||||||
start = time.perf_counter()
|
|
||||||
|
|
||||||
if struct_type == 'linkedlist':
|
|
||||||
head = None
|
|
||||||
for name, phone in records:
|
|
||||||
head = ll_insert(head, name, phone)
|
|
||||||
result = head
|
|
||||||
|
|
||||||
elif struct_type == 'hashtable':
|
|
||||||
size = params.get('size', 1000) if params else 1000
|
|
||||||
buckets = ht_create(size)
|
|
||||||
for name, phone in records:
|
|
||||||
ht_insert(buckets, name, phone)
|
|
||||||
result = buckets
|
|
||||||
|
|
||||||
elif struct_type == 'bst':
|
|
||||||
root = None
|
|
||||||
for name, phone in records:
|
|
||||||
root = bst_insert(root, name, phone)
|
|
||||||
result = root
|
|
||||||
|
|
||||||
end = time.perf_counter()
|
|
||||||
return end - start, result
|
|
||||||
|
|
||||||
def measure_find(structure, names_to_find, struct_type): #Замер времени поиска записей
|
|
||||||
start = time.perf_counter()
|
|
||||||
|
|
||||||
for name in names_to_find:
|
|
||||||
if struct_type == 'linkedlist':
|
|
||||||
ll_find(structure, name)
|
|
||||||
elif struct_type == 'hashtable':
|
|
||||||
ht_find(structure, name)
|
|
||||||
elif struct_type == 'bst':
|
|
||||||
bst_find(structure, name)
|
|
||||||
|
|
||||||
end = time.perf_counter()
|
|
||||||
return end - start
|
|
||||||
|
|
||||||
def measure_delete(structure, names_to_delete, struct_type): #Замер времени удаления записей
|
|
||||||
start = time.perf_counter()
|
|
||||||
|
|
||||||
for name in names_to_delete:
|
|
||||||
if struct_type == 'linkedlist':
|
|
||||||
structure = ll_delete(structure, name)
|
|
||||||
elif struct_type == 'hashtable':
|
|
||||||
ht_delete(structure, name)
|
|
||||||
elif struct_type == 'bst':
|
|
||||||
structure = bst_delete(structure, name)
|
|
||||||
|
|
||||||
end = time.perf_counter()
|
|
||||||
return end - start, structure
|
|
||||||
|
|
||||||
def run_single_experiment(struct_type, mode, data_records, names_to_find, names_to_delete, repeats, params=None): #Запуск одного эксперимента
|
|
||||||
insert_times = []
|
|
||||||
find_times = []
|
|
||||||
delete_times = []
|
|
||||||
|
|
||||||
for i in range(repeats):
|
|
||||||
if struct_type == 'hashtable':
|
|
||||||
insert_time, structure = measure_insert(data_records, struct_type, params)
|
|
||||||
else:
|
|
||||||
insert_time, structure = measure_insert(data_records, struct_type)
|
|
||||||
insert_times.append(insert_time)
|
|
||||||
|
|
||||||
find_time = measure_find(structure, names_to_find, struct_type)
|
|
||||||
find_times.append(find_time)
|
|
||||||
|
|
||||||
delete_time, structure = measure_delete(structure, names_to_delete, struct_type)
|
|
||||||
delete_times.append(delete_time)
|
|
||||||
|
|
||||||
return {
|
|
||||||
'structure': struct_type,
|
|
||||||
'mode': mode,
|
|
||||||
'insert_mean': np.mean(insert_times),
|
|
||||||
'insert_std': np.std(insert_times),
|
|
||||||
'insert_all': insert_times,
|
|
||||||
'find_mean': np.mean(find_times),
|
|
||||||
'find_std': np.std(find_times),
|
|
||||||
'find_all': find_times,
|
|
||||||
'delete_mean': np.mean(delete_times),
|
|
||||||
'delete_std': np.std(delete_times),
|
|
||||||
'delete_all': delete_times
|
|
||||||
}
|
|
||||||
|
|
@ -1,18 +0,0 @@
|
||||||
import random
|
|
||||||
|
|
||||||
def generate_test_data(N): #Генерирует N записей с именами User_00000 ... User_N-1
|
|
||||||
records = [(f"User_{i:05d}", f"+7-999-{i:05d}") for i in range(N)]
|
|
||||||
|
|
||||||
records_shuffled = records.copy()
|
|
||||||
random.shuffle(records_shuffled)
|
|
||||||
|
|
||||||
records_sorted = sorted(records, key=lambda x: x[0])
|
|
||||||
|
|
||||||
return records, records_shuffled, records_sorted
|
|
||||||
|
|
||||||
def get_names_for_operations(records, num_find=100, num_delete=50, num_nonexistent=10): #Подготавливает имена для операций поиска и удаления
|
|
||||||
existing_names = [name for name, _ in records[:num_find + num_delete]]
|
|
||||||
names_to_find = existing_names[:num_find] + [f"None_{i}" for i in range(num_nonexistent)]
|
|
||||||
names_to_delete = existing_names[num_find:num_find + num_delete]
|
|
||||||
|
|
||||||
return names_to_find, names_to_delete
|
|
||||||
|
|
@ -1,29 +0,0 @@
|
||||||
from linkedlist import ll_insert, ll_find, ll_delete, ll_list_all
|
|
||||||
|
|
||||||
def hash_function(name, size):
|
|
||||||
return sum(ord(c) for c in name) % size
|
|
||||||
|
|
||||||
def ht_create(size):
|
|
||||||
return [None] * size
|
|
||||||
|
|
||||||
def ht_insert(buckets, name, phone):
|
|
||||||
index = hash_function(name, len(buckets))
|
|
||||||
buckets[index] = ll_insert(buckets[index], name, phone)
|
|
||||||
|
|
||||||
def ht_find(buckets, name):
|
|
||||||
index = hash_function(name, len(buckets))
|
|
||||||
return ll_find(buckets[index], name)
|
|
||||||
|
|
||||||
def ht_delete(buckets, name):
|
|
||||||
index = hash_function(name, len(buckets))
|
|
||||||
buckets[index] = ll_delete(buckets[index], name)
|
|
||||||
|
|
||||||
def ht_list_all(buckets):
|
|
||||||
records = []
|
|
||||||
for bucket in buckets:
|
|
||||||
current = bucket
|
|
||||||
while current is not None:
|
|
||||||
records.append((current['name'], current['phone']))
|
|
||||||
current = current['next']
|
|
||||||
records.sort(key=lambda x: x[0])
|
|
||||||
return records
|
|
||||||
|
|
@ -1,47 +0,0 @@
|
||||||
def ll_insert(head, name, phone): #Oбновление записи в связном списке
|
|
||||||
if head is None:
|
|
||||||
return {'name': name, 'phone': phone, 'next': None}
|
|
||||||
current = head
|
|
||||||
while current is not None:
|
|
||||||
if current['name'] == name:
|
|
||||||
current['phone'] = phone
|
|
||||||
return head
|
|
||||||
current = current['next']
|
|
||||||
new_node = {'name': name, 'phone': phone, 'next': None}
|
|
||||||
current = head
|
|
||||||
while current['next'] is not None:
|
|
||||||
current = current['next']
|
|
||||||
current['next'] = new_node
|
|
||||||
return head
|
|
||||||
|
|
||||||
def ll_find(head, name): #Поиск телефона по имени
|
|
||||||
current = head
|
|
||||||
while current is not None:
|
|
||||||
if current['name'] == name:
|
|
||||||
return current['phone']
|
|
||||||
current = current['next']
|
|
||||||
return None
|
|
||||||
|
|
||||||
def ll_delete(head, name): #Удаление записи по имени
|
|
||||||
if head is None:
|
|
||||||
return None
|
|
||||||
|
|
||||||
if head['name'] == name:
|
|
||||||
return head['next']
|
|
||||||
|
|
||||||
current = head
|
|
||||||
while current['next'] is not None:
|
|
||||||
if current['next']['name'] == name:
|
|
||||||
current['next'] = current['next']['next']
|
|
||||||
return head
|
|
||||||
current = current['next']
|
|
||||||
return head
|
|
||||||
|
|
||||||
def ll_list_all(head): #Сбор всех записей и сортировка по имени
|
|
||||||
records = []
|
|
||||||
current = head
|
|
||||||
while current is not None:
|
|
||||||
records.append((current['name'], current['phone']))
|
|
||||||
current = current['next']
|
|
||||||
records.sort(key=lambda x: x[0])
|
|
||||||
return records
|
|
||||||
|
|
@ -1,51 +0,0 @@
|
||||||
from config import N, REPEATS, HASH_TABLE_SIZE
|
|
||||||
from generator import generate_test_data, get_names_for_operations
|
|
||||||
from experiment import run_single_experiment
|
|
||||||
from rezults import save_to_csv, plot_results, print_analysis, save_report_md
|
|
||||||
|
|
||||||
def main():
|
|
||||||
print(f"Количество записей: {N}")
|
|
||||||
print(f"Количество повторов: {REPEATS}")
|
|
||||||
print(f"Размер хеш-таблицы: {HASH_TABLE_SIZE}")
|
|
||||||
print()
|
|
||||||
|
|
||||||
records, records_shuffled, records_sorted = generate_test_data(N)
|
|
||||||
names_to_find, names_to_delete = get_names_for_operations(records)
|
|
||||||
|
|
||||||
experiments = [
|
|
||||||
('linkedlist', 'случайный', records_shuffled),
|
|
||||||
('linkedlist', 'отсортированный', records_sorted),
|
|
||||||
('hashtable', 'случайный', records_shuffled),
|
|
||||||
('hashtable', 'отсортированный', records_sorted),
|
|
||||||
('bst', 'случайный', records_shuffled),
|
|
||||||
('bst', 'отсортированный', records_sorted),
|
|
||||||
]
|
|
||||||
|
|
||||||
results = []
|
|
||||||
|
|
||||||
for struct_type, mode, data_records in experiments:
|
|
||||||
print(f"Тестирование: {struct_type} - {mode}")
|
|
||||||
|
|
||||||
params = {'size': HASH_TABLE_SIZE} if struct_type == 'hashtable' else None
|
|
||||||
|
|
||||||
result = run_single_experiment(
|
|
||||||
struct_type, mode, data_records,
|
|
||||||
names_to_find, names_to_delete,
|
|
||||||
REPEATS, params
|
|
||||||
)
|
|
||||||
|
|
||||||
results.append(result)
|
|
||||||
|
|
||||||
print(f" Insert: {result['insert_mean']:.4f} ± {result['insert_std']:.4f} sec")
|
|
||||||
print(f" Find: {result['find_mean']:.4f} ± {result['find_std']:.4f} sec")
|
|
||||||
print(f" Delete: {result['delete_mean']:.4f} ± {result['delete_std']:.4f} sec")
|
|
||||||
print()
|
|
||||||
|
|
||||||
save_to_csv(results)
|
|
||||||
plot_results(results)
|
|
||||||
save_report_md(results)
|
|
||||||
print_analysis(results)
|
|
||||||
|
|
||||||
|
|
||||||
if __name__ == "__main__":
|
|
||||||
main()
|
|
||||||
|
|
@ -1,288 +0,0 @@
|
||||||
import csv
|
|
||||||
import os
|
|
||||||
import numpy as np
|
|
||||||
from matplotlib import pyplot as plt
|
|
||||||
|
|
||||||
def ensure_directories():
|
|
||||||
os.makedirs('docs/data', exist_ok=True)
|
|
||||||
|
|
||||||
def save_to_csv(results, filename="docs/data/results.csv"):
|
|
||||||
ensure_directories()
|
|
||||||
|
|
||||||
with open(filename, 'w', newline='', encoding='utf-8') as f:
|
|
||||||
writer = csv.writer(f)
|
|
||||||
writer.writerow(['Структура', 'Режим', 'Операция',
|
|
||||||
'Повтор1', 'Повтор2', 'Повтор3', 'Повтор4', 'Повтор5',
|
|
||||||
'Среднее', 'Стд_откл'])
|
|
||||||
|
|
||||||
for res in results:
|
|
||||||
struct_name = res['structure']
|
|
||||||
mode = res['mode']
|
|
||||||
|
|
||||||
for op, times, mean, std in [
|
|
||||||
('вставка', res['insert_all'], res['insert_mean'], res['insert_std']),
|
|
||||||
('поиск', res['find_all'], res['find_mean'], res['find_std']),
|
|
||||||
('удаление', res['delete_all'], res['delete_mean'], res['delete_std'])
|
|
||||||
]:
|
|
||||||
row = [struct_name, mode, op] + times + [mean, std]
|
|
||||||
writer.writerow(row)
|
|
||||||
|
|
||||||
def plot_results(results, filename="docs/performance_chart.png"):
|
|
||||||
ensure_directories()
|
|
||||||
struct_names = {
|
|
||||||
'linkedlist': 'LinkedList',
|
|
||||||
'hashtable': 'HashTable',
|
|
||||||
'bst': 'BST'
|
|
||||||
}
|
|
||||||
|
|
||||||
operations = ['insert', 'find', 'delete']
|
|
||||||
op_names = {'insert': 'Вставка', 'find': 'Поиск', 'delete': 'Удаление'}
|
|
||||||
random_data = {}
|
|
||||||
sorted_data = {}
|
|
||||||
|
|
||||||
for res in results:
|
|
||||||
struct_name = struct_names.get(res['structure'], res['structure'])
|
|
||||||
mode = res['mode']
|
|
||||||
|
|
||||||
if mode == 'случайный':
|
|
||||||
random_data[struct_name] = {
|
|
||||||
'insert': res['insert_mean'],
|
|
||||||
'find': res['find_mean'],
|
|
||||||
'delete': res['delete_mean']
|
|
||||||
}
|
|
||||||
else:
|
|
||||||
sorted_data[struct_name] = {
|
|
||||||
'insert': res['insert_mean'],
|
|
||||||
'find': res['find_mean'],
|
|
||||||
'delete': res['delete_mean']
|
|
||||||
}
|
|
||||||
|
|
||||||
structure_order = ['LinkedList', 'HashTable', 'BST']
|
|
||||||
|
|
||||||
fig, axes = plt.subplots(1, 3, figsize=(15, 5))
|
|
||||||
|
|
||||||
for idx, op in enumerate(operations):
|
|
||||||
ax = axes[idx]
|
|
||||||
|
|
||||||
x = np.arange(len(structure_order))
|
|
||||||
width = 0.35
|
|
||||||
|
|
||||||
random_means = []
|
|
||||||
sorted_means = []
|
|
||||||
|
|
||||||
for struct in structure_order:
|
|
||||||
if struct in random_data:
|
|
||||||
random_means.append(random_data[struct][op])
|
|
||||||
else:
|
|
||||||
random_means.append(0)
|
|
||||||
|
|
||||||
if struct in sorted_data:
|
|
||||||
sorted_means.append(sorted_data[struct][op])
|
|
||||||
else:
|
|
||||||
sorted_means.append(0)
|
|
||||||
|
|
||||||
if not random_means and not sorted_means:
|
|
||||||
print(f" Нет данных для операции {op}")
|
|
||||||
continue
|
|
||||||
|
|
||||||
bars1 = ax.bar(x - width/2, random_means, width,
|
|
||||||
label='Случайный порядок', color='skyblue')
|
|
||||||
bars2 = ax.bar(x + width/2, sorted_means, width,
|
|
||||||
label='Отсортированный порядок', color='salmon')
|
|
||||||
|
|
||||||
ax.set_xlabel('Структура данных')
|
|
||||||
ax.set_ylabel('Время (секунды)')
|
|
||||||
ax.set_title(f'{op_names.get(op, op)}')
|
|
||||||
ax.set_xticks(x)
|
|
||||||
ax.set_xticklabels(structure_order)
|
|
||||||
ax.legend()
|
|
||||||
|
|
||||||
for bar in bars1 + bars2:
|
|
||||||
height = bar.get_height()
|
|
||||||
if height > 0:
|
|
||||||
ax.annotate(f'{height:.3f}',
|
|
||||||
xy=(bar.get_x() + bar.get_width() / 2, height),
|
|
||||||
xytext=(0, 3), textcoords="offset points",
|
|
||||||
ha='center', va='bottom', fontsize=8)
|
|
||||||
|
|
||||||
plt.tight_layout()
|
|
||||||
plt.savefig(filename, dpi=150)
|
|
||||||
plt.show()
|
|
||||||
|
|
||||||
def save_report_md(results, filename="docs/report.md"):
|
|
||||||
ensure_directories()
|
|
||||||
|
|
||||||
results_dict = {}
|
|
||||||
for res in results:
|
|
||||||
key = (res['structure'], res['mode'])
|
|
||||||
results_dict[key] = res
|
|
||||||
|
|
||||||
def get_val(struct, mode, field):
|
|
||||||
key = (struct, mode)
|
|
||||||
if key in results_dict:return results_dict[key][field]
|
|
||||||
return 0.0
|
|
||||||
|
|
||||||
ll_random_insert = get_val('linkedlist', 'случайный', 'insert_mean')
|
|
||||||
ll_random_find = get_val('linkedlist', 'случайный', 'find_mean')
|
|
||||||
ll_random_delete = get_val('linkedlist', 'случайный', 'delete_mean')
|
|
||||||
ll_sorted_insert = get_val('linkedlist', 'отсортированный', 'insert_mean')
|
|
||||||
ll_sorted_find = get_val('linkedlist', 'отсортированный', 'find_mean')
|
|
||||||
ll_sorted_delete = get_val('linkedlist', 'отсортированный', 'delete_mean')
|
|
||||||
|
|
||||||
ht_random_insert = get_val('hashtable', 'случайный', 'insert_mean')
|
|
||||||
ht_random_find = get_val('hashtable', 'случайный', 'find_mean')
|
|
||||||
ht_random_delete = get_val('hashtable', 'случайный', 'delete_mean')
|
|
||||||
ht_sorted_insert = get_val('hashtable', 'отсортированный', 'insert_mean')
|
|
||||||
ht_sorted_find = get_val('hashtable', 'отсортированный', 'find_mean')
|
|
||||||
ht_sorted_delete = get_val('hashtable', 'отсортированный', 'delete_mean')
|
|
||||||
|
|
||||||
bst_random_insert = get_val('bst', 'случайный', 'insert_mean')
|
|
||||||
bst_random_find = get_val('bst', 'случайный', 'find_mean')
|
|
||||||
bst_random_delete = get_val('bst', 'случайный', 'delete_mean')
|
|
||||||
bst_sorted_insert = get_val('bst', 'отсортированный', 'insert_mean')
|
|
||||||
bst_sorted_find = get_val('bst', 'отсортированный', 'find_mean')
|
|
||||||
bst_sorted_delete = get_val('bst', 'отсортированный', 'delete_mean')
|
|
||||||
|
|
||||||
from datetime import datetime
|
|
||||||
|
|
||||||
report_content = f"""# Отчёт по лабораторной работе
|
|
||||||
|
|
||||||
## Цель работы
|
|
||||||
|
|
||||||
Реализовать три структуры данных «с нуля» (связный список, хеш-таблица, двоичное дерево поиска), применить их для хранения записей телефонного справочника и экспериментально сравнить производительность основных операций.
|
|
||||||
|
|
||||||
## Параметры эксперимента
|
|
||||||
|
|
||||||
- Количество записей: 10000
|
|
||||||
- Количество повторов каждого теста: 5
|
|
||||||
- Размер хеш-таблицы: 1000 корзин
|
|
||||||
|
|
||||||
## Результаты экспериментов
|
|
||||||
|
|
||||||
### 1. Связный список
|
|
||||||
|
|
||||||
| Режим | Вставка (сек) | Поиск (сек) | Удаление (сек) |
|
|
||||||
|-------|---------------|-------------|----------------|
|
|
||||||
| Случайный | {ll_random_insert:.4f} | {ll_random_find:.4f} | {ll_random_delete:.4f} |
|
|
||||||
| Отсортированный | {ll_sorted_insert:.4f} | {ll_sorted_find:.4f} | {ll_sorted_delete:.4f} |
|
|
||||||
|
|
||||||
### 2. Хеш-таблица
|
|
||||||
|
|
||||||
| Режим | Вставка (сек) | Поиск (сек) | Удаление (сек) |
|
|
||||||
|-------|---------------|-------------|----------------|
|
|
||||||
| Случайный | {ht_random_insert:.4f} | {ht_random_find:.4f} | {ht_random_delete:.4f} |
|
|
||||||
| Отсортированный | {ht_sorted_insert:.4f} | {ht_sorted_find:.4f} | {ht_sorted_delete:.4f} |
|
|
||||||
|
|
||||||
### 3. Двоичное дерево поиска (BST)
|
|
||||||
|
|
||||||
| Режим | Вставка (сек) | Поиск (сек) | Удаление (сек) |
|
|
||||||
|-------|---------------|-------------|----------------|
|
|
||||||
| Случайный | {bst_random_insert:.4f} | {bst_random_find:.4f} | {bst_random_delete:.4f} |
|
|
||||||
| Отсортированный | {bst_sorted_insert:.4f} | {bst_sorted_find:.4f} | {bst_sorted_delete:.4f} |
|
|
||||||
|
|
||||||
## Анализ результатов
|
|
||||||
|
|
||||||
### 1. Влияние порядка данных на BST
|
|
||||||
При добавлении уже отсортированных элементов BST вырождается в линейную структуру — сложность падает с O(log n) до O(n).
|
|
||||||
Время вставки выросло с {bst_random_insert:.4f} до {bst_sorted_insert:.4f} секунд — замедление в {bst_sorted_insert/bst_random_insert:.1f} раза.
|
|
||||||
|
|
||||||
### 2. Почему хеш-таблица не чувствительна к порядку
|
|
||||||
|
|
||||||
Хеш-функция равномерно распределяет ключи по корзинам независимо от их исходного порядка. Поэтому последовательность добавления практически не влияет на производительность.
|
|
||||||
Сравнение случайного и упорядоченного ввода:
|
|
||||||
- Случайный режим: {ht_random_insert:.4f} с
|
|
||||||
- Упорядоченный режим: {ht_sorted_insert:.4f} с
|
|
||||||
- Различие: {ht_sorted_insert/ht_random_insert:.2f}
|
|
||||||
|
|
||||||
### 3. Почему связный список медленный при поиске
|
|
||||||
|
|
||||||
Поиск в связном списке требует линейного обхода O(n) — структура не поддерживает произвольный доступ. Это делает его непригодным для крупных справочников, где нужен быстрый поиск по ключу.
|
|
||||||
|
|
||||||
Сравнение скорости поиска на случайных данных:
|
|
||||||
- LinkedList: {ll_random_find:.4f} сек
|
|
||||||
- HashTable: {ht_random_find:.4f} сек (преимущество в {ll_random_find/ht_random_find:.1f})
|
|
||||||
- BST: {bst_random_find:.4f} сек
|
|
||||||
|
|
||||||
### 4. Сравнение удаления
|
|
||||||
|
|
||||||
| Структура | Сложность | Время на 50 удалений (случайные данные) |
|
|
||||||
|-----------|-----------|------------------------------------------|
|
|
||||||
| Связный список | O(n) | {ll_random_delete:.4f} сек|
|
|
||||||
| Хеш-таблица | O(1) в среднем | {ht_random_delete:.4f} сек |
|
|
||||||
| BST | O(log n) в среднем | {bst_random_delete:.4f} сек |
|
|
||||||
|
|
||||||
## Вывод:
|
|
||||||
|
|
||||||
| Задача | Рекомендация | Почему |
|
|
||||||
|--------|-------------|--------|
|
|
||||||
| Частый поиск | Хеш-таблица | O(1) в среднем, не зависит от порядка |
|
|
||||||
| Частые вставки/удаления | Хеш-таблица | Амортизированное O(1) |
|
|
||||||
| Нужен отсортированный вывод | Сбалансированное дерево (AVL/Red-Black) | In-order обход даёт сортировку |
|
|
||||||
| Мало данных (<100 элементов) | Связный список или массив | Простота, накладные расходы не оправданы |
|
|
||||||
| Последовательный доступ (очередь/стек) | Связный список | Вставка/удаление в начало/конец за O(1) |
|
|
||||||
|
|
||||||
## Заключение
|
|
||||||
Проведённый эксперимент подтверждает теоретические оценки сложности:
|
|
||||||
|
|
||||||
1. **Небалансированное BST это плохой выбор** при работе с реальными данными, которые могут оказаться упорядоченными. Деградация до O(n) делает его непригодным для надёжных систем.
|
|
||||||
|
|
||||||
2. **Хеш-таблица показывает стабильные результаты** вне зависимости от порядка входных данных — ключевое преимущество для телефонного справочника с произвольными именами абонентов.
|
|
||||||
|
|
||||||
3. **Связный список — нишевый инструмент**, эффективный только при работе с малыми объёмами данных.
|
|
||||||
|
|
||||||
"""
|
|
||||||
|
|
||||||
with open(filename, 'w', encoding='utf-8') as f:
|
|
||||||
f.write(report_content)
|
|
||||||
|
|
||||||
def print_analysis(results):
|
|
||||||
print("\n" + "="*60)
|
|
||||||
print("Анализ результатов")
|
|
||||||
print("="*60)
|
|
||||||
|
|
||||||
best_insert = min(results, key=lambda x: x['insert_mean'])
|
|
||||||
best_find = min(results, key=lambda x: x['find_mean'])
|
|
||||||
best_delete = min(results, key=lambda x: x['delete_mean'])
|
|
||||||
|
|
||||||
print(f"\n Лучшая для вставки: {best_insert['structure']} ({best_insert['mode']}) - {best_insert['insert_mean']:.4f} сек")
|
|
||||||
print(f" Лучшая для поиска: {best_find['structure']} ({best_find['mode']}) - {best_find['find_mean']:.4f} сек")
|
|
||||||
print(f" Лучшая для удаления: {best_delete['structure']} ({best_delete['mode']}) - {best_delete['delete_mean']:.4f} сек")
|
|
||||||
|
|
||||||
bst_random = None
|
|
||||||
bst_sorted = None
|
|
||||||
for res in results:
|
|
||||||
if res['structure'] == 'bst' and res['mode'] == 'случайный':
|
|
||||||
bst_random = res
|
|
||||||
elif res['structure'] == 'bst' and res['mode'] == 'отсортированный':
|
|
||||||
bst_sorted = res
|
|
||||||
|
|
||||||
if bst_random and bst_sorted:
|
|
||||||
print("\n Влияние порядка данных на BST:")
|
|
||||||
print(f" Вставка: случайный {bst_random['insert_mean']:.4f} сек vs отсортированный {bst_sorted['insert_mean']:.4f} сек")
|
|
||||||
print(f" Деградация в {bst_sorted['insert_mean']/bst_random['insert_mean']:.1f}x")
|
|
||||||
|
|
||||||
ht_random = None
|
|
||||||
ht_sorted = None
|
|
||||||
for res in results:
|
|
||||||
if res['structure'] == 'hashtable' and res['mode'] == 'случайный':
|
|
||||||
ht_random = res
|
|
||||||
elif res['structure'] == 'hashtable' and res['mode'] == 'отсортированный':
|
|
||||||
ht_sorted = res
|
|
||||||
|
|
||||||
if ht_random and ht_sorted:
|
|
||||||
print("\n Чувствительность хеш-таблицы к порядку:")
|
|
||||||
print(f" Вставка: случайный {ht_random['insert_mean']:.4f} сек vs отсортированный {ht_sorted['insert_mean']:.4f} сек")
|
|
||||||
print(f" Отношение: {ht_sorted['insert_mean']/ht_random['insert_mean']:.2f}x (почти не чувствительна)")
|
|
||||||
|
|
||||||
ll_random = None
|
|
||||||
for res in results:
|
|
||||||
if res['structure'] == 'linkedlist' and res['mode'] == 'случайный':
|
|
||||||
ll_random = res
|
|
||||||
elif res['structure'] == 'hashtable' and res['mode'] == 'случайный':
|
|
||||||
ht_random = res
|
|
||||||
|
|
||||||
if ll_random and ht_random:
|
|
||||||
print("\n Сравнение скорости поиска:")
|
|
||||||
print(f" LinkedList: {ll_random['find_mean']:.4f} сек")
|
|
||||||
print(f" HashTable: {ht_random['find_mean']:.4f} сек")
|
|
||||||
print(f" HashTable быстрее в {ll_random['find_mean']/ht_random['find_mean']:.1f} раз")
|
|
||||||
Loading…
Reference in New Issue
Block a user