forked from UNN/2026-rff_mp
1 laba
This commit is contained in:
parent
6491d3a79e
commit
c708d708e3
79
ZelentsovAV/task1/bst.py
Normal file
79
ZelentsovAV/task1/bst.py
Normal file
|
|
@ -0,0 +1,79 @@
|
||||||
|
def bst_insert(root, name, phone):
|
||||||
|
new_node = {'name': name, 'phone': phone, 'left': None, 'right': None}
|
||||||
|
|
||||||
|
if root is None:
|
||||||
|
return new_node
|
||||||
|
|
||||||
|
current = root
|
||||||
|
while True:
|
||||||
|
if name < current['name']:
|
||||||
|
if current['left'] is None:
|
||||||
|
current['left'] = new_node
|
||||||
|
break
|
||||||
|
else:
|
||||||
|
current = current['left']
|
||||||
|
elif name > current['name']:
|
||||||
|
if current['right'] is None:
|
||||||
|
current['right'] = new_node
|
||||||
|
break
|
||||||
|
else:
|
||||||
|
current = current['right']
|
||||||
|
else:
|
||||||
|
current['phone'] = phone
|
||||||
|
break
|
||||||
|
|
||||||
|
return root
|
||||||
|
|
||||||
|
def bst_find(root, name): #Итеративный поиск в BST
|
||||||
|
current = root
|
||||||
|
while current is not None:
|
||||||
|
if name == current['name']:
|
||||||
|
return current['phone']
|
||||||
|
elif name < current['name']:
|
||||||
|
current = current['left']
|
||||||
|
else:
|
||||||
|
current = current['right']
|
||||||
|
return None
|
||||||
|
|
||||||
|
def bst_find_min(root): #Поиск минимального узла
|
||||||
|
current = root
|
||||||
|
while current['left'] is not None:
|
||||||
|
current = current['left']
|
||||||
|
return current
|
||||||
|
|
||||||
|
def bst_delete(root, name): # Рекурсия только в глубину
|
||||||
|
if root is None:
|
||||||
|
return None
|
||||||
|
|
||||||
|
if name < root['name']:
|
||||||
|
root['left'] = bst_delete(root['left'], name)
|
||||||
|
elif name > root['name']:
|
||||||
|
root['right'] = bst_delete(root['right'], name)
|
||||||
|
else:
|
||||||
|
if root['left'] is None:
|
||||||
|
return root['right']
|
||||||
|
elif root['right'] is None:
|
||||||
|
return root['left']
|
||||||
|
else:
|
||||||
|
min_node = bst_find_min(root['right'])
|
||||||
|
root['name'] = min_node['name']
|
||||||
|
root['phone'] = min_node['phone']
|
||||||
|
root['right'] = bst_delete(root['right'], min_node['name'])
|
||||||
|
return root
|
||||||
|
|
||||||
|
def bst_list_all(root, records=None): #Возвращает отсортированные записи
|
||||||
|
if records is None:
|
||||||
|
records = []
|
||||||
|
|
||||||
|
stack = []
|
||||||
|
current = root
|
||||||
|
|
||||||
|
while stack or current:
|
||||||
|
while current is not None:
|
||||||
|
stack.append(current)
|
||||||
|
current = current['left']
|
||||||
|
current = stack.pop()
|
||||||
|
records.append((current['name'], current['phone']))
|
||||||
|
current = current['right']
|
||||||
|
|
||||||
|
return records
|
||||||
3
ZelentsovAV/task1/config.py
Normal file
3
ZelentsovAV/task1/config.py
Normal file
|
|
@ -0,0 +1,3 @@
|
||||||
|
N = 10000 # Количество записей
|
||||||
|
REPEATS = 5 # Количество повторений каждого эксперимента
|
||||||
|
HASH_TABLE_SIZE = 1000 # Размер хеш-таблиц
|
||||||
19
ZelentsovAV/task1/docs/data/results.csv
Normal file
19
ZelentsovAV/task1/docs/data/results.csv
Normal file
|
|
@ -0,0 +1,19 @@
|
||||||
|
Структура,Режим,Операция,Повтор1,Повтор2,Повтор3,Повтор4,Повтор5,Среднее,Стд_откл
|
||||||
|
linkedlist,случайный,вставка,6.12412660010159,6.453428599983454,6.0159983998164535,5.846197799779475,6.687424399890006,6.225435159914196,0.3044218200660184
|
||||||
|
linkedlist,случайный,поиск,0.04134450014680624,0.04073229990899563,0.042916799895465374,0.04113580007106066,0.05696159973740578,0.044618199951946734,0.006216087497843716
|
||||||
|
linkedlist,случайный,удаление,0.026781500317156315,0.027109399437904358,0.030823000706732273,0.02719919942319393,0.03118100017309189,0.028618820011615753,0.001954103193777089
|
||||||
|
linkedlist,отсортированный,вставка,6.631766900420189,5.748658500611782,5.798537000082433,6.062226499430835,5.308409399352968,5.909919659979641,0.43462320783889524
|
||||||
|
linkedlist,отсортированный,поиск,0.006313499994575977,0.005670599639415741,0.005590200424194336,0.005645200610160828,0.005786299705505371,0.005801160074770451,0.0002640402924000638
|
||||||
|
linkedlist,отсортированный,удаление,0.0005609998479485512,0.0005288999527692795,0.0005288999527692795,0.0006311992183327675,0.0005285991355776787,0.0005557196214795113,3.9747101397961354e-05
|
||||||
|
hashtable,случайный,вставка,0.4039090992882848,0.43919940013438463,0.5127053996548057,0.4458825998008251,0.5722195003181696,0.47478319983929396,0.06009411868526661
|
||||||
|
hashtable,случайный,поиск,0.0011500995606184006,0.0015127994120121002,0.0014458000659942627,0.0015266994014382362,0.0016105994582176208,0.001449199579656124,0.0001584761558930157
|
||||||
|
hashtable,случайный,удаление,0.0006000008434057236,0.0006478000432252884,0.0006513996049761772,0.0006491998210549355,0.0006536999717354774,0.0006404200568795205,2.0308460750476644e-05
|
||||||
|
hashtable,отсортированный,вставка,0.41475220024585724,0.36477189976722,0.4018732002004981,0.34626630041748285,0.3364391000941396,0.37282054014503957,0.030645843485620654
|
||||||
|
hashtable,отсортированный,поиск,0.00014910008758306503,0.00021160021424293518,0.00014139991253614426,0.00013990048319101334,0.00014150049537420273,0.0001567002385854721,2.763741512756699e-05
|
||||||
|
hashtable,отсортированный,удаление,0.00010520033538341522,0.00011090002954006195,9.95006412267685e-05,9.809993207454681e-05,9.940005838871002e-05,0.0001026201993227005,4.811371049160917e-06
|
||||||
|
bst,случайный,вставка,0.02877839934080839,0.023240000009536743,0.023904399946331978,0.02267790026962757,0.02133959997445345,0.023988059908151626,0.0025394803712577006
|
||||||
|
bst,случайный,поиск,0.00018490012735128403,0.00017419923096895218,0.0001809997484087944,0.0001767994835972786,0.0001687007024884224,0.00017711985856294632,5.569578481417004e-06
|
||||||
|
bst,случайный,удаление,0.00012159999459981918,0.0001150006428360939,0.0001226002350449562,0.00011949986219406128,0.00011199992150068283,0.00011814013123512268,4.0316401567625745e-06
|
||||||
|
bst,отсортированный,вставка,6.140015699900687,7.042814400047064,6.089983900077641,7.145617099478841,7.014688899740577,6.686623999848962,0.46902726732451255
|
||||||
|
bst,отсортированный,поиск,0.0004746001213788986,0.0004603993147611618,0.0005575995892286301,0.0004612002521753311,0.0005747005343437195,0.0005056999623775482,4.9908362408772585e-05
|
||||||
|
bst,отсортированный,удаление,0.0007436992600560188,0.0007255999371409416,0.0007277000695466995,0.0007218997925519943,0.0010781008750200272,0.0007993999868631362,0.00013954953359056988
|
||||||
|
BIN
ZelentsovAV/task1/docs/performance_chart.png
Normal file
BIN
ZelentsovAV/task1/docs/performance_chart.png
Normal file
Binary file not shown.
|
After Width: | Height: | Size: 73 KiB |
85
ZelentsovAV/task1/docs/report.md
Normal file
85
ZelentsovAV/task1/docs/report.md
Normal file
|
|
@ -0,0 +1,85 @@
|
||||||
|
# Отчёт по лабораторной работе
|
||||||
|
|
||||||
|
## Цель работы
|
||||||
|
|
||||||
|
Реализовать три структуры данных «с нуля» (связный список, хеш-таблица, двоичное дерево поиска), применить их для хранения записей телефонного справочника и экспериментально сравнить производительность основных операций.
|
||||||
|
|
||||||
|
## Параметры эксперимента
|
||||||
|
|
||||||
|
- Количество записей: 10000
|
||||||
|
- Количество повторов каждого теста: 5
|
||||||
|
- Размер хеш-таблицы: 1000 корзин
|
||||||
|
|
||||||
|
## Результаты экспериментов
|
||||||
|
|
||||||
|
### 1. Связный список
|
||||||
|
|
||||||
|
| Режим | Вставка (сек) | Поиск (сек) | Удаление (сек) |
|
||||||
|
|-------|---------------|-------------|----------------|
|
||||||
|
| Случайный | 6.2254 | 0.0446 | 0.0286 |
|
||||||
|
| Отсортированный | 5.9099 | 0.0058 | 0.0006 |
|
||||||
|
|
||||||
|
### 2. Хеш-таблица
|
||||||
|
|
||||||
|
| Режим | Вставка (сек) | Поиск (сек) | Удаление (сек) |
|
||||||
|
|-------|---------------|-------------|----------------|
|
||||||
|
| Случайный | 0.4748 | 0.0014 | 0.0006 |
|
||||||
|
| Отсортированный | 0.3728 | 0.0002 | 0.0001 |
|
||||||
|
|
||||||
|
### 3. Двоичное дерево поиска (BST)
|
||||||
|
|
||||||
|
| Режим | Вставка (сек) | Поиск (сек) | Удаление (сек) |
|
||||||
|
|-------|---------------|-------------|----------------|
|
||||||
|
| Случайный | 0.0240 | 0.0002 | 0.0001 |
|
||||||
|
| Отсортированный | 6.6866 | 0.0005 | 0.0008 |
|
||||||
|
|
||||||
|
## Анализ результатов
|
||||||
|
|
||||||
|
### 1. Влияние порядка данных на BST
|
||||||
|
При добавлении уже отсортированных элементов BST вырождается в линейную структуру — сложность падает с O(log n) до O(n).
|
||||||
|
Время вставки выросло с 0.0240 до 6.6866 секунд — замедление в 278.7 раза.
|
||||||
|
|
||||||
|
### 2. Почему хеш-таблица не чувствительна к порядку
|
||||||
|
|
||||||
|
Хеш-функция равномерно распределяет ключи по корзинам независимо от их исходного порядка. Поэтому последовательность добавления практически не влияет на производительность.
|
||||||
|
Сравнение случайного и упорядоченного ввода:
|
||||||
|
- Случайный режим: 0.4748 с
|
||||||
|
- Упорядоченный режим: 0.3728 с
|
||||||
|
- Различие: 0.79
|
||||||
|
|
||||||
|
### 3. Почему связный список медленный при поиске
|
||||||
|
|
||||||
|
Поиск в связном списке требует линейного обхода O(n) — структура не поддерживает произвольный доступ. Это делает его непригодным для крупных справочников, где нужен быстрый поиск по ключу.
|
||||||
|
|
||||||
|
Сравнение скорости поиска на случайных данных:
|
||||||
|
- LinkedList: 0.0446 сек
|
||||||
|
- HashTable: 0.0014 сек (преимущество в 30.8)
|
||||||
|
- BST: 0.0002 сек
|
||||||
|
|
||||||
|
### 4. Сравнение удаления
|
||||||
|
|
||||||
|
| Структура | Сложность | Время на 50 удалений (случайные данные) |
|
||||||
|
|-----------|-----------|------------------------------------------|
|
||||||
|
| Связный список | O(n) | 0.0286 сек|
|
||||||
|
| Хеш-таблица | O(1) в среднем | 0.0006 сек |
|
||||||
|
| BST | O(log n) в среднем | 0.0001 сек |
|
||||||
|
|
||||||
|
## Вывод:
|
||||||
|
|
||||||
|
| Задача | Рекомендация | Почему |
|
||||||
|
|--------|-------------|--------|
|
||||||
|
| Частый поиск | Хеш-таблица | O(1) в среднем, не зависит от порядка |
|
||||||
|
| Частые вставки/удаления | Хеш-таблица | Амортизированное O(1) |
|
||||||
|
| Нужен отсортированный вывод | Сбалансированное дерево (AVL/Red-Black) | In-order обход даёт сортировку |
|
||||||
|
| Мало данных (<100 элементов) | Связный список или массив | Простота, накладные расходы не оправданы |
|
||||||
|
| Последовательный доступ (очередь/стек) | Связный список | Вставка/удаление в начало/конец за O(1) |
|
||||||
|
|
||||||
|
## Заключение
|
||||||
|
Проведённый эксперимент подтверждает теоретические оценки сложности:
|
||||||
|
|
||||||
|
1. **Небалансированное BST это плохой выбор** при работе с реальными данными, которые могут оказаться упорядоченными. Деградация до O(n) делает его непригодным для надёжных систем.
|
||||||
|
|
||||||
|
2. **Хеш-таблица показывает стабильные результаты** вне зависимости от порядка входных данных — ключевое преимущество для телефонного справочника с произвольными именами абонентов.
|
||||||
|
|
||||||
|
3. **Связный список — нишевый инструмент**, эффективный только при работе с малыми объёмами данных.
|
||||||
|
|
||||||
90
ZelentsovAV/task1/experiment.py
Normal file
90
ZelentsovAV/task1/experiment.py
Normal file
|
|
@ -0,0 +1,90 @@
|
||||||
|
import time
|
||||||
|
import numpy as np
|
||||||
|
from linkedlist import ll_insert, ll_find, ll_delete
|
||||||
|
from hashtable import ht_create, ht_insert, ht_find, ht_delete
|
||||||
|
from bst import bst_insert, bst_find, bst_delete
|
||||||
|
|
||||||
|
def measure_insert(records, struct_type, params=None): #Замер времени вставки всех записей
|
||||||
|
start = time.perf_counter()
|
||||||
|
|
||||||
|
if struct_type == 'linkedlist':
|
||||||
|
head = None
|
||||||
|
for name, phone in records:
|
||||||
|
head = ll_insert(head, name, phone)
|
||||||
|
result = head
|
||||||
|
|
||||||
|
elif struct_type == 'hashtable':
|
||||||
|
size = params.get('size', 1000) if params else 1000
|
||||||
|
buckets = ht_create(size)
|
||||||
|
for name, phone in records:
|
||||||
|
ht_insert(buckets, name, phone)
|
||||||
|
result = buckets
|
||||||
|
|
||||||
|
elif struct_type == 'bst':
|
||||||
|
root = None
|
||||||
|
for name, phone in records:
|
||||||
|
root = bst_insert(root, name, phone)
|
||||||
|
result = root
|
||||||
|
|
||||||
|
end = time.perf_counter()
|
||||||
|
return end - start, result
|
||||||
|
|
||||||
|
def measure_find(structure, names_to_find, struct_type): #Замер времени поиска записей
|
||||||
|
start = time.perf_counter()
|
||||||
|
|
||||||
|
for name in names_to_find:
|
||||||
|
if struct_type == 'linkedlist':
|
||||||
|
ll_find(structure, name)
|
||||||
|
elif struct_type == 'hashtable':
|
||||||
|
ht_find(structure, name)
|
||||||
|
elif struct_type == 'bst':
|
||||||
|
bst_find(structure, name)
|
||||||
|
|
||||||
|
end = time.perf_counter()
|
||||||
|
return end - start
|
||||||
|
|
||||||
|
def measure_delete(structure, names_to_delete, struct_type): #Замер времени удаления записей
|
||||||
|
start = time.perf_counter()
|
||||||
|
|
||||||
|
for name in names_to_delete:
|
||||||
|
if struct_type == 'linkedlist':
|
||||||
|
structure = ll_delete(structure, name)
|
||||||
|
elif struct_type == 'hashtable':
|
||||||
|
ht_delete(structure, name)
|
||||||
|
elif struct_type == 'bst':
|
||||||
|
structure = bst_delete(structure, name)
|
||||||
|
|
||||||
|
end = time.perf_counter()
|
||||||
|
return end - start, structure
|
||||||
|
|
||||||
|
def run_single_experiment(struct_type, mode, data_records, names_to_find, names_to_delete, repeats, params=None): #Запуск одного эксперимента
|
||||||
|
insert_times = []
|
||||||
|
find_times = []
|
||||||
|
delete_times = []
|
||||||
|
|
||||||
|
for i in range(repeats):
|
||||||
|
if struct_type == 'hashtable':
|
||||||
|
insert_time, structure = measure_insert(data_records, struct_type, params)
|
||||||
|
else:
|
||||||
|
insert_time, structure = measure_insert(data_records, struct_type)
|
||||||
|
insert_times.append(insert_time)
|
||||||
|
|
||||||
|
find_time = measure_find(structure, names_to_find, struct_type)
|
||||||
|
find_times.append(find_time)
|
||||||
|
|
||||||
|
delete_time, structure = measure_delete(structure, names_to_delete, struct_type)
|
||||||
|
delete_times.append(delete_time)
|
||||||
|
|
||||||
|
return {
|
||||||
|
'structure': struct_type,
|
||||||
|
'mode': mode,
|
||||||
|
'insert_mean': np.mean(insert_times),
|
||||||
|
'insert_std': np.std(insert_times),
|
||||||
|
'insert_all': insert_times,
|
||||||
|
'find_mean': np.mean(find_times),
|
||||||
|
'find_std': np.std(find_times),
|
||||||
|
'find_all': find_times,
|
||||||
|
'delete_mean': np.mean(delete_times),
|
||||||
|
'delete_std': np.std(delete_times),
|
||||||
|
'delete_all': delete_times
|
||||||
|
}
|
||||||
18
ZelentsovAV/task1/generator.py
Normal file
18
ZelentsovAV/task1/generator.py
Normal file
|
|
@ -0,0 +1,18 @@
|
||||||
|
import random
|
||||||
|
|
||||||
|
def generate_test_data(N): #Генерирует N записей с именами User_00000 ... User_N-1
|
||||||
|
records = [(f"User_{i:05d}", f"+7-999-{i:05d}") for i in range(N)]
|
||||||
|
|
||||||
|
records_shuffled = records.copy()
|
||||||
|
random.shuffle(records_shuffled)
|
||||||
|
|
||||||
|
records_sorted = sorted(records, key=lambda x: x[0])
|
||||||
|
|
||||||
|
return records, records_shuffled, records_sorted
|
||||||
|
|
||||||
|
def get_names_for_operations(records, num_find=100, num_delete=50, num_nonexistent=10): #Подготавливает имена для операций поиска и удаления
|
||||||
|
existing_names = [name for name, _ in records[:num_find + num_delete]]
|
||||||
|
names_to_find = existing_names[:num_find] + [f"None_{i}" for i in range(num_nonexistent)]
|
||||||
|
names_to_delete = existing_names[num_find:num_find + num_delete]
|
||||||
|
|
||||||
|
return names_to_find, names_to_delete
|
||||||
29
ZelentsovAV/task1/hashtable.py
Normal file
29
ZelentsovAV/task1/hashtable.py
Normal file
|
|
@ -0,0 +1,29 @@
|
||||||
|
from linkedlist import ll_insert, ll_find, ll_delete, ll_list_all
|
||||||
|
|
||||||
|
def hash_function(name, size):
|
||||||
|
return sum(ord(c) for c in name) % size
|
||||||
|
|
||||||
|
def ht_create(size):
|
||||||
|
return [None] * size
|
||||||
|
|
||||||
|
def ht_insert(buckets, name, phone):
|
||||||
|
index = hash_function(name, len(buckets))
|
||||||
|
buckets[index] = ll_insert(buckets[index], name, phone)
|
||||||
|
|
||||||
|
def ht_find(buckets, name):
|
||||||
|
index = hash_function(name, len(buckets))
|
||||||
|
return ll_find(buckets[index], name)
|
||||||
|
|
||||||
|
def ht_delete(buckets, name):
|
||||||
|
index = hash_function(name, len(buckets))
|
||||||
|
buckets[index] = ll_delete(buckets[index], name)
|
||||||
|
|
||||||
|
def ht_list_all(buckets):
|
||||||
|
records = []
|
||||||
|
for bucket in buckets:
|
||||||
|
current = bucket
|
||||||
|
while current is not None:
|
||||||
|
records.append((current['name'], current['phone']))
|
||||||
|
current = current['next']
|
||||||
|
records.sort(key=lambda x: x[0])
|
||||||
|
return records
|
||||||
47
ZelentsovAV/task1/linkedlist.py
Normal file
47
ZelentsovAV/task1/linkedlist.py
Normal file
|
|
@ -0,0 +1,47 @@
|
||||||
|
def ll_insert(head, name, phone): #Oбновление записи в связном списке
|
||||||
|
if head is None:
|
||||||
|
return {'name': name, 'phone': phone, 'next': None}
|
||||||
|
current = head
|
||||||
|
while current is not None:
|
||||||
|
if current['name'] == name:
|
||||||
|
current['phone'] = phone
|
||||||
|
return head
|
||||||
|
current = current['next']
|
||||||
|
new_node = {'name': name, 'phone': phone, 'next': None}
|
||||||
|
current = head
|
||||||
|
while current['next'] is not None:
|
||||||
|
current = current['next']
|
||||||
|
current['next'] = new_node
|
||||||
|
return head
|
||||||
|
|
||||||
|
def ll_find(head, name): #Поиск телефона по имени
|
||||||
|
current = head
|
||||||
|
while current is not None:
|
||||||
|
if current['name'] == name:
|
||||||
|
return current['phone']
|
||||||
|
current = current['next']
|
||||||
|
return None
|
||||||
|
|
||||||
|
def ll_delete(head, name): #Удаление записи по имени
|
||||||
|
if head is None:
|
||||||
|
return None
|
||||||
|
|
||||||
|
if head['name'] == name:
|
||||||
|
return head['next']
|
||||||
|
|
||||||
|
current = head
|
||||||
|
while current['next'] is not None:
|
||||||
|
if current['next']['name'] == name:
|
||||||
|
current['next'] = current['next']['next']
|
||||||
|
return head
|
||||||
|
current = current['next']
|
||||||
|
return head
|
||||||
|
|
||||||
|
def ll_list_all(head): #Сбор всех записей и сортировка по имени
|
||||||
|
records = []
|
||||||
|
current = head
|
||||||
|
while current is not None:
|
||||||
|
records.append((current['name'], current['phone']))
|
||||||
|
current = current['next']
|
||||||
|
records.sort(key=lambda x: x[0])
|
||||||
|
return records
|
||||||
51
ZelentsovAV/task1/main.py
Normal file
51
ZelentsovAV/task1/main.py
Normal file
|
|
@ -0,0 +1,51 @@
|
||||||
|
from config import N, REPEATS, HASH_TABLE_SIZE
|
||||||
|
from generator import generate_test_data, get_names_for_operations
|
||||||
|
from experiment import run_single_experiment
|
||||||
|
from rezults import save_to_csv, plot_results, print_analysis, save_report_md
|
||||||
|
|
||||||
|
def main():
|
||||||
|
print(f"Количество записей: {N}")
|
||||||
|
print(f"Количество повторов: {REPEATS}")
|
||||||
|
print(f"Размер хеш-таблицы: {HASH_TABLE_SIZE}")
|
||||||
|
print()
|
||||||
|
|
||||||
|
records, records_shuffled, records_sorted = generate_test_data(N)
|
||||||
|
names_to_find, names_to_delete = get_names_for_operations(records)
|
||||||
|
|
||||||
|
experiments = [
|
||||||
|
('linkedlist', 'случайный', records_shuffled),
|
||||||
|
('linkedlist', 'отсортированный', records_sorted),
|
||||||
|
('hashtable', 'случайный', records_shuffled),
|
||||||
|
('hashtable', 'отсортированный', records_sorted),
|
||||||
|
('bst', 'случайный', records_shuffled),
|
||||||
|
('bst', 'отсортированный', records_sorted),
|
||||||
|
]
|
||||||
|
|
||||||
|
results = []
|
||||||
|
|
||||||
|
for struct_type, mode, data_records in experiments:
|
||||||
|
print(f"Тестирование: {struct_type} - {mode}")
|
||||||
|
|
||||||
|
params = {'size': HASH_TABLE_SIZE} if struct_type == 'hashtable' else None
|
||||||
|
|
||||||
|
result = run_single_experiment(
|
||||||
|
struct_type, mode, data_records,
|
||||||
|
names_to_find, names_to_delete,
|
||||||
|
REPEATS, params
|
||||||
|
)
|
||||||
|
|
||||||
|
results.append(result)
|
||||||
|
|
||||||
|
print(f" Insert: {result['insert_mean']:.4f} ± {result['insert_std']:.4f} sec")
|
||||||
|
print(f" Find: {result['find_mean']:.4f} ± {result['find_std']:.4f} sec")
|
||||||
|
print(f" Delete: {result['delete_mean']:.4f} ± {result['delete_std']:.4f} sec")
|
||||||
|
print()
|
||||||
|
|
||||||
|
save_to_csv(results)
|
||||||
|
plot_results(results)
|
||||||
|
save_report_md(results)
|
||||||
|
print_analysis(results)
|
||||||
|
|
||||||
|
|
||||||
|
if __name__ == "__main__":
|
||||||
|
main()
|
||||||
288
ZelentsovAV/task1/rezults.py
Normal file
288
ZelentsovAV/task1/rezults.py
Normal file
|
|
@ -0,0 +1,288 @@
|
||||||
|
import csv
|
||||||
|
import os
|
||||||
|
import numpy as np
|
||||||
|
from matplotlib import pyplot as plt
|
||||||
|
|
||||||
|
def ensure_directories():
|
||||||
|
os.makedirs('docs/data', exist_ok=True)
|
||||||
|
|
||||||
|
def save_to_csv(results, filename="docs/data/results.csv"):
|
||||||
|
ensure_directories()
|
||||||
|
|
||||||
|
with open(filename, 'w', newline='', encoding='utf-8') as f:
|
||||||
|
writer = csv.writer(f)
|
||||||
|
writer.writerow(['Структура', 'Режим', 'Операция',
|
||||||
|
'Повтор1', 'Повтор2', 'Повтор3', 'Повтор4', 'Повтор5',
|
||||||
|
'Среднее', 'Стд_откл'])
|
||||||
|
|
||||||
|
for res in results:
|
||||||
|
struct_name = res['structure']
|
||||||
|
mode = res['mode']
|
||||||
|
|
||||||
|
for op, times, mean, std in [
|
||||||
|
('вставка', res['insert_all'], res['insert_mean'], res['insert_std']),
|
||||||
|
('поиск', res['find_all'], res['find_mean'], res['find_std']),
|
||||||
|
('удаление', res['delete_all'], res['delete_mean'], res['delete_std'])
|
||||||
|
]:
|
||||||
|
row = [struct_name, mode, op] + times + [mean, std]
|
||||||
|
writer.writerow(row)
|
||||||
|
|
||||||
|
def plot_results(results, filename="docs/performance_chart.png"):
|
||||||
|
ensure_directories()
|
||||||
|
struct_names = {
|
||||||
|
'linkedlist': 'LinkedList',
|
||||||
|
'hashtable': 'HashTable',
|
||||||
|
'bst': 'BST'
|
||||||
|
}
|
||||||
|
|
||||||
|
operations = ['insert', 'find', 'delete']
|
||||||
|
op_names = {'insert': 'Вставка', 'find': 'Поиск', 'delete': 'Удаление'}
|
||||||
|
random_data = {}
|
||||||
|
sorted_data = {}
|
||||||
|
|
||||||
|
for res in results:
|
||||||
|
struct_name = struct_names.get(res['structure'], res['structure'])
|
||||||
|
mode = res['mode']
|
||||||
|
|
||||||
|
if mode == 'случайный':
|
||||||
|
random_data[struct_name] = {
|
||||||
|
'insert': res['insert_mean'],
|
||||||
|
'find': res['find_mean'],
|
||||||
|
'delete': res['delete_mean']
|
||||||
|
}
|
||||||
|
else:
|
||||||
|
sorted_data[struct_name] = {
|
||||||
|
'insert': res['insert_mean'],
|
||||||
|
'find': res['find_mean'],
|
||||||
|
'delete': res['delete_mean']
|
||||||
|
}
|
||||||
|
|
||||||
|
structure_order = ['LinkedList', 'HashTable', 'BST']
|
||||||
|
|
||||||
|
fig, axes = plt.subplots(1, 3, figsize=(15, 5))
|
||||||
|
|
||||||
|
for idx, op in enumerate(operations):
|
||||||
|
ax = axes[idx]
|
||||||
|
|
||||||
|
x = np.arange(len(structure_order))
|
||||||
|
width = 0.35
|
||||||
|
|
||||||
|
random_means = []
|
||||||
|
sorted_means = []
|
||||||
|
|
||||||
|
for struct in structure_order:
|
||||||
|
if struct in random_data:
|
||||||
|
random_means.append(random_data[struct][op])
|
||||||
|
else:
|
||||||
|
random_means.append(0)
|
||||||
|
|
||||||
|
if struct in sorted_data:
|
||||||
|
sorted_means.append(sorted_data[struct][op])
|
||||||
|
else:
|
||||||
|
sorted_means.append(0)
|
||||||
|
|
||||||
|
if not random_means and not sorted_means:
|
||||||
|
print(f" Нет данных для операции {op}")
|
||||||
|
continue
|
||||||
|
|
||||||
|
bars1 = ax.bar(x - width/2, random_means, width,
|
||||||
|
label='Случайный порядок', color='skyblue')
|
||||||
|
bars2 = ax.bar(x + width/2, sorted_means, width,
|
||||||
|
label='Отсортированный порядок', color='salmon')
|
||||||
|
|
||||||
|
ax.set_xlabel('Структура данных')
|
||||||
|
ax.set_ylabel('Время (секунды)')
|
||||||
|
ax.set_title(f'{op_names.get(op, op)}')
|
||||||
|
ax.set_xticks(x)
|
||||||
|
ax.set_xticklabels(structure_order)
|
||||||
|
ax.legend()
|
||||||
|
|
||||||
|
for bar in bars1 + bars2:
|
||||||
|
height = bar.get_height()
|
||||||
|
if height > 0:
|
||||||
|
ax.annotate(f'{height:.3f}',
|
||||||
|
xy=(bar.get_x() + bar.get_width() / 2, height),
|
||||||
|
xytext=(0, 3), textcoords="offset points",
|
||||||
|
ha='center', va='bottom', fontsize=8)
|
||||||
|
|
||||||
|
plt.tight_layout()
|
||||||
|
plt.savefig(filename, dpi=150)
|
||||||
|
plt.show()
|
||||||
|
|
||||||
|
def save_report_md(results, filename="docs/report.md"):
|
||||||
|
ensure_directories()
|
||||||
|
|
||||||
|
results_dict = {}
|
||||||
|
for res in results:
|
||||||
|
key = (res['structure'], res['mode'])
|
||||||
|
results_dict[key] = res
|
||||||
|
|
||||||
|
def get_val(struct, mode, field):
|
||||||
|
key = (struct, mode)
|
||||||
|
if key in results_dict:return results_dict[key][field]
|
||||||
|
return 0.0
|
||||||
|
|
||||||
|
ll_random_insert = get_val('linkedlist', 'случайный', 'insert_mean')
|
||||||
|
ll_random_find = get_val('linkedlist', 'случайный', 'find_mean')
|
||||||
|
ll_random_delete = get_val('linkedlist', 'случайный', 'delete_mean')
|
||||||
|
ll_sorted_insert = get_val('linkedlist', 'отсортированный', 'insert_mean')
|
||||||
|
ll_sorted_find = get_val('linkedlist', 'отсортированный', 'find_mean')
|
||||||
|
ll_sorted_delete = get_val('linkedlist', 'отсортированный', 'delete_mean')
|
||||||
|
|
||||||
|
ht_random_insert = get_val('hashtable', 'случайный', 'insert_mean')
|
||||||
|
ht_random_find = get_val('hashtable', 'случайный', 'find_mean')
|
||||||
|
ht_random_delete = get_val('hashtable', 'случайный', 'delete_mean')
|
||||||
|
ht_sorted_insert = get_val('hashtable', 'отсортированный', 'insert_mean')
|
||||||
|
ht_sorted_find = get_val('hashtable', 'отсортированный', 'find_mean')
|
||||||
|
ht_sorted_delete = get_val('hashtable', 'отсортированный', 'delete_mean')
|
||||||
|
|
||||||
|
bst_random_insert = get_val('bst', 'случайный', 'insert_mean')
|
||||||
|
bst_random_find = get_val('bst', 'случайный', 'find_mean')
|
||||||
|
bst_random_delete = get_val('bst', 'случайный', 'delete_mean')
|
||||||
|
bst_sorted_insert = get_val('bst', 'отсортированный', 'insert_mean')
|
||||||
|
bst_sorted_find = get_val('bst', 'отсортированный', 'find_mean')
|
||||||
|
bst_sorted_delete = get_val('bst', 'отсортированный', 'delete_mean')
|
||||||
|
|
||||||
|
from datetime import datetime
|
||||||
|
|
||||||
|
report_content = f"""# Отчёт по лабораторной работе
|
||||||
|
|
||||||
|
## Цель работы
|
||||||
|
|
||||||
|
Реализовать три структуры данных «с нуля» (связный список, хеш-таблица, двоичное дерево поиска), применить их для хранения записей телефонного справочника и экспериментально сравнить производительность основных операций.
|
||||||
|
|
||||||
|
## Параметры эксперимента
|
||||||
|
|
||||||
|
- Количество записей: 10000
|
||||||
|
- Количество повторов каждого теста: 5
|
||||||
|
- Размер хеш-таблицы: 1000 корзин
|
||||||
|
|
||||||
|
## Результаты экспериментов
|
||||||
|
|
||||||
|
### 1. Связный список
|
||||||
|
|
||||||
|
| Режим | Вставка (сек) | Поиск (сек) | Удаление (сек) |
|
||||||
|
|-------|---------------|-------------|----------------|
|
||||||
|
| Случайный | {ll_random_insert:.4f} | {ll_random_find:.4f} | {ll_random_delete:.4f} |
|
||||||
|
| Отсортированный | {ll_sorted_insert:.4f} | {ll_sorted_find:.4f} | {ll_sorted_delete:.4f} |
|
||||||
|
|
||||||
|
### 2. Хеш-таблица
|
||||||
|
|
||||||
|
| Режим | Вставка (сек) | Поиск (сек) | Удаление (сек) |
|
||||||
|
|-------|---------------|-------------|----------------|
|
||||||
|
| Случайный | {ht_random_insert:.4f} | {ht_random_find:.4f} | {ht_random_delete:.4f} |
|
||||||
|
| Отсортированный | {ht_sorted_insert:.4f} | {ht_sorted_find:.4f} | {ht_sorted_delete:.4f} |
|
||||||
|
|
||||||
|
### 3. Двоичное дерево поиска (BST)
|
||||||
|
|
||||||
|
| Режим | Вставка (сек) | Поиск (сек) | Удаление (сек) |
|
||||||
|
|-------|---------------|-------------|----------------|
|
||||||
|
| Случайный | {bst_random_insert:.4f} | {bst_random_find:.4f} | {bst_random_delete:.4f} |
|
||||||
|
| Отсортированный | {bst_sorted_insert:.4f} | {bst_sorted_find:.4f} | {bst_sorted_delete:.4f} |
|
||||||
|
|
||||||
|
## Анализ результатов
|
||||||
|
|
||||||
|
### 1. Влияние порядка данных на BST
|
||||||
|
При добавлении уже отсортированных элементов BST вырождается в линейную структуру — сложность падает с O(log n) до O(n).
|
||||||
|
Время вставки выросло с {bst_random_insert:.4f} до {bst_sorted_insert:.4f} секунд — замедление в {bst_sorted_insert/bst_random_insert:.1f} раза.
|
||||||
|
|
||||||
|
### 2. Почему хеш-таблица не чувствительна к порядку
|
||||||
|
|
||||||
|
Хеш-функция равномерно распределяет ключи по корзинам независимо от их исходного порядка. Поэтому последовательность добавления практически не влияет на производительность.
|
||||||
|
Сравнение случайного и упорядоченного ввода:
|
||||||
|
- Случайный режим: {ht_random_insert:.4f} с
|
||||||
|
- Упорядоченный режим: {ht_sorted_insert:.4f} с
|
||||||
|
- Различие: {ht_sorted_insert/ht_random_insert:.2f}
|
||||||
|
|
||||||
|
### 3. Почему связный список медленный при поиске
|
||||||
|
|
||||||
|
Поиск в связном списке требует линейного обхода O(n) — структура не поддерживает произвольный доступ. Это делает его непригодным для крупных справочников, где нужен быстрый поиск по ключу.
|
||||||
|
|
||||||
|
Сравнение скорости поиска на случайных данных:
|
||||||
|
- LinkedList: {ll_random_find:.4f} сек
|
||||||
|
- HashTable: {ht_random_find:.4f} сек (преимущество в {ll_random_find/ht_random_find:.1f})
|
||||||
|
- BST: {bst_random_find:.4f} сек
|
||||||
|
|
||||||
|
### 4. Сравнение удаления
|
||||||
|
|
||||||
|
| Структура | Сложность | Время на 50 удалений (случайные данные) |
|
||||||
|
|-----------|-----------|------------------------------------------|
|
||||||
|
| Связный список | O(n) | {ll_random_delete:.4f} сек|
|
||||||
|
| Хеш-таблица | O(1) в среднем | {ht_random_delete:.4f} сек |
|
||||||
|
| BST | O(log n) в среднем | {bst_random_delete:.4f} сек |
|
||||||
|
|
||||||
|
## Вывод:
|
||||||
|
|
||||||
|
| Задача | Рекомендация | Почему |
|
||||||
|
|--------|-------------|--------|
|
||||||
|
| Частый поиск | Хеш-таблица | O(1) в среднем, не зависит от порядка |
|
||||||
|
| Частые вставки/удаления | Хеш-таблица | Амортизированное O(1) |
|
||||||
|
| Нужен отсортированный вывод | Сбалансированное дерево (AVL/Red-Black) | In-order обход даёт сортировку |
|
||||||
|
| Мало данных (<100 элементов) | Связный список или массив | Простота, накладные расходы не оправданы |
|
||||||
|
| Последовательный доступ (очередь/стек) | Связный список | Вставка/удаление в начало/конец за O(1) |
|
||||||
|
|
||||||
|
## Заключение
|
||||||
|
Проведённый эксперимент подтверждает теоретические оценки сложности:
|
||||||
|
|
||||||
|
1. **Небалансированное BST это плохой выбор** при работе с реальными данными, которые могут оказаться упорядоченными. Деградация до O(n) делает его непригодным для надёжных систем.
|
||||||
|
|
||||||
|
2. **Хеш-таблица показывает стабильные результаты** вне зависимости от порядка входных данных — ключевое преимущество для телефонного справочника с произвольными именами абонентов.
|
||||||
|
|
||||||
|
3. **Связный список — нишевый инструмент**, эффективный только при работе с малыми объёмами данных.
|
||||||
|
|
||||||
|
"""
|
||||||
|
|
||||||
|
with open(filename, 'w', encoding='utf-8') as f:
|
||||||
|
f.write(report_content)
|
||||||
|
|
||||||
|
def print_analysis(results):
|
||||||
|
print("\n" + "="*60)
|
||||||
|
print("Анализ результатов")
|
||||||
|
print("="*60)
|
||||||
|
|
||||||
|
best_insert = min(results, key=lambda x: x['insert_mean'])
|
||||||
|
best_find = min(results, key=lambda x: x['find_mean'])
|
||||||
|
best_delete = min(results, key=lambda x: x['delete_mean'])
|
||||||
|
|
||||||
|
print(f"\n Лучшая для вставки: {best_insert['structure']} ({best_insert['mode']}) - {best_insert['insert_mean']:.4f} сек")
|
||||||
|
print(f" Лучшая для поиска: {best_find['structure']} ({best_find['mode']}) - {best_find['find_mean']:.4f} сек")
|
||||||
|
print(f" Лучшая для удаления: {best_delete['structure']} ({best_delete['mode']}) - {best_delete['delete_mean']:.4f} сек")
|
||||||
|
|
||||||
|
bst_random = None
|
||||||
|
bst_sorted = None
|
||||||
|
for res in results:
|
||||||
|
if res['structure'] == 'bst' and res['mode'] == 'случайный':
|
||||||
|
bst_random = res
|
||||||
|
elif res['structure'] == 'bst' and res['mode'] == 'отсортированный':
|
||||||
|
bst_sorted = res
|
||||||
|
|
||||||
|
if bst_random and bst_sorted:
|
||||||
|
print("\n Влияние порядка данных на BST:")
|
||||||
|
print(f" Вставка: случайный {bst_random['insert_mean']:.4f} сек vs отсортированный {bst_sorted['insert_mean']:.4f} сек")
|
||||||
|
print(f" Деградация в {bst_sorted['insert_mean']/bst_random['insert_mean']:.1f}x")
|
||||||
|
|
||||||
|
ht_random = None
|
||||||
|
ht_sorted = None
|
||||||
|
for res in results:
|
||||||
|
if res['structure'] == 'hashtable' and res['mode'] == 'случайный':
|
||||||
|
ht_random = res
|
||||||
|
elif res['structure'] == 'hashtable' and res['mode'] == 'отсортированный':
|
||||||
|
ht_sorted = res
|
||||||
|
|
||||||
|
if ht_random and ht_sorted:
|
||||||
|
print("\n Чувствительность хеш-таблицы к порядку:")
|
||||||
|
print(f" Вставка: случайный {ht_random['insert_mean']:.4f} сек vs отсортированный {ht_sorted['insert_mean']:.4f} сек")
|
||||||
|
print(f" Отношение: {ht_sorted['insert_mean']/ht_random['insert_mean']:.2f}x (почти не чувствительна)")
|
||||||
|
|
||||||
|
ll_random = None
|
||||||
|
for res in results:
|
||||||
|
if res['structure'] == 'linkedlist' and res['mode'] == 'случайный':
|
||||||
|
ll_random = res
|
||||||
|
elif res['structure'] == 'hashtable' and res['mode'] == 'случайный':
|
||||||
|
ht_random = res
|
||||||
|
|
||||||
|
if ll_random and ht_random:
|
||||||
|
print("\n Сравнение скорости поиска:")
|
||||||
|
print(f" LinkedList: {ll_random['find_mean']:.4f} сек")
|
||||||
|
print(f" HashTable: {ht_random['find_mean']:.4f} сек")
|
||||||
|
print(f" HashTable быстрее в {ll_random['find_mean']/ht_random['find_mean']:.1f} раз")
|
||||||
Loading…
Reference in New Issue
Block a user