2026-03-30 14:47:24 +00:00
{
"cells": [
{
"cell_type": "markdown",
"id": "2acfa743",
"metadata": {},
"source": [
"# 0. Подготовим окружение"
]
},
{
"cell_type": "code",
2026-04-11 11:23:15 +00:00
"execution_count": 8,
2026-03-30 14:47:24 +00:00
"id": "4689b73e",
"metadata": {},
"outputs": [],
"source": [
"import sys\n",
"import os\n",
"sys.path.insert(0, os.path.abspath( '../task1'))\n",
"sys.path.insert(0, os.path.abspath( '../'))"
]
},
{
"cell_type": "markdown",
"id": "37cc11a5",
"metadata": {},
"source": [
"# 1. Генерация тестовых данных\n",
"\n",
"Создадим список records из N=10000 элементов. Каждый элемент — кортеж (name, phone). \n",
"Имена возъмём случайные из небольшого набора (чтобы были повторения и коллизии). \n",
"Для проверки влияния порядка подготовим два варианта: \n",
"\n",
"_records_shuffled_ — случайный порядок. \n",
"_records_sorted_ — отсортированный по имени (по алфавиту)."
]
},
{
"cell_type": "code",
2026-04-11 11:23:15 +00:00
"execution_count": 9,
2026-04-02 22:31:26 +00:00
"id": "a3b5c31b",
2026-03-30 14:47:24 +00:00
"metadata": {},
"outputs": [],
"source": [
"from util.randomNames import generate_test_data\n",
2026-04-02 22:31:26 +00:00
"from util.timeTester import test\n",
2026-03-30 14:47:24 +00:00
"\n",
2026-04-02 22:31:26 +00:00
"records_shuffled = generate_test_data(N=10000)\n",
"records_sorted = generate_test_data(N=10000, _sorted=True)"
2026-03-30 14:47:24 +00:00
]
},
{
"cell_type": "markdown",
"id": "c2f4989c",
"metadata": {},
"source": [
2026-04-02 22:31:26 +00:00
"# 2. Проведение замеров"
2026-03-30 14:47:24 +00:00
]
},
{
"cell_type": "code",
2026-04-11 11:23:15 +00:00
"execution_count": 10,
2026-04-02 22:31:26 +00:00
"id": "df12d41d",
2026-03-30 14:47:24 +00:00
"metadata": {},
2026-04-02 22:31:26 +00:00
"outputs": [],
2026-03-30 14:47:24 +00:00
"source": [
2026-04-02 22:31:26 +00:00
"# Подготовим функции СД, которые будем тестировать\n",
2026-03-30 14:47:24 +00:00
"from structures.LinkedList import *\n",
"from structures.HashTable import *\n",
"from structures.BinaryTree import *\n",
"\n",
2026-04-02 22:31:26 +00:00
"func_list = {\"Связанный список\" : (ll_insert, ll_find, ll_delete),\n",
" \"Хэш-таблица\" : (ht_insert, ht_find, ht_delete),\n",
" \"Бинарное дерево\" : (bst_insert, bst_find, bst_delete)}"
2026-03-30 14:47:24 +00:00
]
},
{
2026-04-02 22:31:26 +00:00
"cell_type": "code",
2026-04-11 11:23:15 +00:00
"execution_count": 11,
2026-04-02 22:31:26 +00:00
"id": "cc8d0436",
2026-03-30 14:47:24 +00:00
"metadata": {},
2026-04-02 22:31:26 +00:00
"outputs": [],
2026-03-30 14:47:24 +00:00
"source": [
2026-04-02 22:31:26 +00:00
"# Проведём замеры\n",
"report = [[\"Структура\", \"Режим\", \"Вставка\", \"Поиск\", \"Удаление\"]]\n",
"records = {\"Cлу ча йный\" : records_shuffled, \"Отсортированный\" : records_sorted}\n",
"\n",
"TEST_ITERATIONS_NUM = 5\n",
"\n",
"for _ in range(TEST_ITERATIONS_NUM):\n",
" for mode, data in records.items():\n",
" for struct_name, fns in func_list.items():\n",
" result = test(data, *fns)\n",
" row = [struct_name, mode,\n",
" result[\"insert_time\"],\n",
" result[\"find_time\"],\n",
" result[\"delete_time\"]]\n",
" report.append(row)"
2026-03-30 14:47:24 +00:00
]
},
{
"cell_type": "code",
2026-04-11 11:23:15 +00:00
"execution_count": 12,
2026-04-02 22:31:26 +00:00
"id": "2eedf056",
2026-03-30 14:47:24 +00:00
"metadata": {},
"outputs": [],
2026-04-02 22:31:26 +00:00
"source": [
"# Сохраним данные в csv\n",
"import csv\n",
2026-04-11 11:23:15 +00:00
"with open(\"data/task1/results.csv\", \"w\", newline=\"\") as f:\n",
2026-04-02 22:31:26 +00:00
" writer = csv.writer(f)\n",
" writer.writerows(report)"
]
2026-04-05 07:06:28 +00:00
},
2026-04-11 11:23:15 +00:00
{
"cell_type": "markdown",
"id": "94335af1",
"metadata": {},
"source": [
"# 3. Построение графиков и их анализ"
]
},
2026-04-05 07:06:28 +00:00
{
"cell_type": "code",
2026-04-11 11:23:15 +00:00
"execution_count": 13,
"id": "cad64d2f",
2026-04-05 07:06:28 +00:00
"metadata": {},
2026-04-11 11:23:15 +00:00
"outputs": [
{
"data": {
"image/png": "iVBORw0KGgoAAAANSUhEUgAABdEAAAHqCAYAAADrpwd3AAAAOXRFWHRTb2Z0d2FyZQBNYXRwbG90bGliIHZlcnNpb24zLjYuMywgaHR0cHM6Ly9tYXRwbG90bGliLm9yZy/P9b71AAAACXBIWXMAAA9hAAAPYQGoP6dpAACcZElEQVR4nOzde1xVZfr///eWo2migoEUIFqjkKUF5YDiYUwMyzx+pCysPBSDpUJpovLJLCPLbOcokqUxTqXMZ0jtwCQ4o6RJNiDYNFGaoZjBGFqSppx/f/hl/9zuvREU3IKv5+OxHtO+17Xu+157kGvti3uvZaitra0VAAAAAAAAAACw0MbeEwAAAAAAAAAA4EpFER0AAAAAAAAAABsoogMAAAAAAAAAYANFdAAAAAAAAAAAbKCIDgAAAAAAAACADRTRAQAAAAAAAACwgSI6AAAAAAAAAAA2UEQHAAAAAAAAAMAGiugAAAAAAAAAANhAER1owVJSUmQwGMy2Ll26aPDgwfroo4/sPT0AANCErOX987du3brZe5oAAABAq0MRHWgF3n77bWVnZ2vXrl1avXq1HBwcNHLkSH344Yf2nhoAAGhidXn//K1///72nhoAAK3eyy+/LIPBoA8++MBiX0lJiZydnTV69OjLPzEAzcrR3hMAcOl69+6t4OBg0+u7775bnTp10vr16zVy5Eg7zgwAADS18/N+nY4dO+qHH36ww4wAALh6TJ06VQsXLtSf/vQn3XfffWb7Vq1apcrKSj355JN2mh2A5sJKdKAVcnV1lbOzs5ycnExt5eXlWrRokQICAuTq6ip3d3cNGTJEu3btkqQLfj188ODBkqQzZ87oqaeeUt++feXm5qbOnTsrJCREmzdvtpjHucc7ODjI29tbDz/8sP773/+aYg4ePCiDwaCUlBRTW2lpqW699VYFBASopKTE1L5y5UoNHDhQ1113ndq1a6dbbrlFL7/8siorK5v4HQQAoOU7c+aM4uPj5e/vL2dnZ11//fWaPn26fvnlF7O4bt266ZFHHjFr+8tf/mL19jAXup6Qzub/hQsXml6fPn1aQ4cOVdeuXfXNN9808VkCAHB5de7cWQ8++KC2bt2qgoICU3tFRYXeeOMN3XzzzRo6dKgdZwigOVBEB1qB6upqVVVVqbKyUj/88INmzZqlU6dOaeLEiZKkqqoqRURE6Pnnn9e9996rjRs3KiUlRaGhoSoqKpIks6+DL1iwQJL0/vvvm9qSkpIknf3wfPz4cT399NPatGmT1q9frwEDBmjs2LFat26dxdymTJmi7OxsZWVlafbs2UpNTdWjjz5q81xKS0v1hz/8QZWVldq2bZu8vLxM+w4cOKCJEyfqL3/5iz766CNNmTJFr7zyih5//PEmey8BAGgNamtrNXr0aC1dulRRUVH6+OOPFRcXpz//+c/6wx/+oPLycpvHlpWVac6cOXJwcDBrb8j1xPlOnz6te++9V19//bW2bdumXr16Nel5AgBgD3Urzf/0pz+Z2lJTU/Xf//7XYhX6I488YnWh2vl/wE5NTVV4eLi6du2qtm3bKiAgQHPnztWpU6eszsHWAriDBw+aYmpra5WUlKS+ffuqbdu26tSpk8aPH6/vv//erK/Bgwerd+/eFmMsXbrUos/G/PG9oqJCL7zwgnr16iUXFxd16dJFjz76qH766Ser5wRcybidC9AK/P73vzd77eLiohUrVmj48OGSpPXr12vbtm168803NXXqVFPcubd6ObePulVit912m0USdHNz09tvv216XV1draFDh+rnn3+W0WjUpEmTzOJvuOEGU98DBgzQp59+arZa7VylpaUaOnSo1QK6JC1btsz03zU1NQoLC5O7u7seffRRvfrqq+rUqZP1NwgAgKtMRkaGtmzZopdfflmzZ8+WJA0bNkw+Pj6KjIzUunXrNG3aNKvHPvvss3JwcNDo0aOVk5Njam/I9cS5Tp8+rZEjR1JABwC0OrfeeqsGDhyodevWKTExUW5ubvrTn/6kTp06KSoqyiK+bdu2+uc//2l6/Yc//MEiZv/+/RoxYoRmzZqldu3a6ZtvvtGSJUv0xRdfmB17rilTpphy8scff6wXXnjBbP/jjz+ulJQUzZgxQ0uWLNHx48e1aNEihYaGau/evfL09LyUt0GS7T++19TUaNSoUdqxY4fmzJmj0NBQHTp0SM8++6wGDx6snJwctW3b9pLHBy4XiuhAK7Bu3ToFBARIOluI3rhxo6ZPn67q6mo98cQT+vvf/y5XV1dNnjy5Scb7v//7PxmNRu3du9fsr+Kurq4WsTU1NaqqqlJ1dbW++OIL7dy5U8OGDbOIO3bsmIYOHaovv/xS//nPfywK6JKUl5enZ599Vp999pmOHz9utm/fvn3q169fE5wdAAAtX92H7fNXiv3P//yPJk+erH/84x9Wi+hfffWVVqxYoXfeeUd///vfzfY15nri9OnTuu+++/SPf/xDH3/8MQV0AECr8+STT+p//ud/9Pbbb6tfv37617/+paefflrXXHONWVx5ebmcnJzMFq61aWN5Y4i6b4RLZ1eQ9+/fXwEBARo0aJC+/PJL3Xrrrab9FRUVks6uCq/r9/xbpn3++ed688039eqrryouLs7UHhYWpt/97ndatmyZlixZcgnvwFm2/vj+17/+VZ988onS0tI0duxYU3ufPn10xx13KCUlRX/84x8veXzgcuF2LkArEBAQoODgYAUHB+vuu+/WG2+8ofDwcM2ZM0e//PKLfvrpJ3l7e1tN1I31/vvva8KECbr++uv1zjvvKDs7W//61780efJknTlzxiL++eefl5OTk1xdXTVw4EDdeOONMhqNFnHz5s1TRUWFvLy8lJCQYLG/qKhIYWFhOnLkiF5//XXt2LFD//rXv7Ry5UpJZz+sAwCAs44dOyZHR0d16dLFrN1gMMjLy0vHjh2zetz06dMVFhamyMhIi32NuZ4wGo366quv1KtXLy1atEhVVVUXdyIAAFyhRo8eLR8fH61YsUJGo1EODg6aPn26RdzJkyctCuvWfP/995o4caK8vLzk4OAgJycnDRo0SJLM7r0u/f+ff60tZKvz0UcfyWAw6KGHHlJVVZVp8/LyUp8+fbR9+3aLY86Nq6qqUk1NTb1zrvvj+6uvvqr27dtbjN+xY0eNHDnSrM++ffvKy8vL6vjAlYyV6EArdeutt2rLli3at2+funTpop07d6qmpuaSC+nvvPOO/P39lZqaKoPBYGq3dW/VadOm6bHHHlNtba1+/PFHvfjiiwoJCVF+fr6uvfZaU1z37t21bds27d27VxEREVqzZo2mTJli2r9p0yadOnVK77//vvz8/Ezt+fn5l3Q+AAC0Ru7u7qqqqtJPP/1kVkivra1VSUmJ7rjjDotj3n33XWVnZ9vMrY25nujcubO2bdumiooK3XnnnXruuef0/PPPX9I5AQBwJXF0dNQf//hHzZs3TwcOHNDo0aMtbocqSUeOHJG3t3e9fZ08eVJhYWFydXXVCy+8oN/97ne65pprdPjwYY0dO9Zi0VhpaakkycPDw2af//3vf1VbW2vzli3du3c3e/2f//xHTk5O9c7zfOf+8f38b7D997//1S+//CJnZ2erx9adA9BSUEQHWqm6D8BdunRRRESE1q9fr5SUlEu+pYvBYJCzs7NZAb2kpESbN2+2Gu/t7a3g4GDT69raWo0ZM0bZ2dkKDw83tT/zzDPy8vKSl5eXnnzySc2cOdP0NbO6caWz93s/t68333zzks4HAIDWaOjQoXr55Zf1zjvvKDY21tSelpamU6dOaejQoWbxv/76q2bPnq2ZM2cqMDDQap+NuZ54/PHHTbdwSUxM1NNPP63w8HCFhYVd4pkBAHDlmDZtmhYtWqQzZ85oxowZFvsrKytVUFBg9Rte5/rnP/+pH3/8Udu3bzetPpekX375xWr8/v37JUk33nijzT49PDxkMBi0Y8cOs8/Rdc5v69GjhzZs2GDW9s477+j111+32v+F/vju4eEhd3d3ffLJJ1b3n7uoDmgJKKIDrcBXX31l+pr0sWPH9P777yszM1N
"text/plain": [
"<Figure size 1500x500 with 3 Axes>"
]
},
"metadata": {},
"output_type": "display_data"
}
],
2026-04-05 07:06:28 +00:00
"source": [
2026-04-11 11:23:15 +00:00
"import pandas as pd\n",
"import numpy as np\n",
"import matplotlib.pyplot as plt\n",
"\n",
"df = pd.read_csv('data/task1/results.csv')\n",
"mean_times = df.groupby(['Структура', 'Режим'])[['Вставка', 'Поиск', 'Удаление']].mean().reset_index()\n",
"structures = mean_times['Структура'].unique()\n",
"modes = mean_times['Режим'].unique()\n",
"\n",
"fig, axes = plt.subplots(1, 3, figsize=(15, 5))\n",
"operations = ['Вставка', 'Поиск', 'Удаление']\n",
"\n",
"for ax, op in zip(axes, operations):\n",
" # a\n",
" x = np.arange(len(structures))\n",
" width = 0.35\n",
" \n",
" random_vals = []\n",
" sorted_vals = []\n",
" for s in structures:\n",
" random_row = mean_times[(mean_times['Структура']==s) & (mean_times['Режим']=='Cлу ча йный')]\n",
" sorted_row = mean_times[(mean_times['Структура']==s) & (mean_times['Режим']=='Отсортированный')]\n",
" random_vals.append(random_row[op].values[0] if not random_row.empty else 0)\n",
" sorted_vals.append(sorted_row[op].values[0] if not sorted_row.empty else 0)\n",
" \n",
" ax.bar(x - width/2, random_vals, width, label='Случайный')\n",
" ax.bar(x + width/2, sorted_vals, width, label='Отсортированный')\n",
" ax.set_xticks(x)\n",
" ax.set_xticklabels(structures)\n",
" ax.set_ylabel('Время (сек)')\n",
" ax.set_title(op)\n",
" ax.legend()\n",
"\n",
"plt.tight_layout()\n",
"plt.savefig('data/task1/performance_plot.png', dpi=150)\n",
"plt.show()"
]
},
{
"cell_type": "code",
"execution_count": 14,
"id": "1d86131d",
"metadata": {},
"outputs": [
{
"data": {
"text/html": [
"<div>\n",
"<style scoped>\n",
" .dataframe tbody tr th:only-of-type {\n",
" vertical-align: middle;\n",
" }\n",
"\n",
" .dataframe tbody tr th {\n",
" vertical-align: top;\n",
" }\n",
"\n",
" .dataframe thead th {\n",
" text-align: right;\n",
" }\n",
"</style>\n",
"<table border=\"1\" class=\"dataframe\">\n",
" <thead>\n",
" <tr style=\"text-align: right;\">\n",
" <th></th>\n",
" <th>Структура</th>\n",
" <th>Режим</th>\n",
" <th>Вставка</th>\n",
" <th>Поиск</th>\n",
" <th>Удаление</th>\n",
" </tr>\n",
" </thead>\n",
" <tbody>\n",
" <tr>\n",
" <th>0</th>\n",
" <td>Бинарное дерево</td>\n",
" <td>Cлу ча йный</td>\n",
" <td>0.011921</td>\n",
" <td>0.000150</td>\n",
" <td>0.000137</td>\n",
" </tr>\n",
" <tr>\n",
" <th>1</th>\n",
" <td>Бинарное дерево</td>\n",
" <td>Отсортированный</td>\n",
" <td>0.122171</td>\n",
" <td>0.001627</td>\n",
" <td>0.000873</td>\n",
" </tr>\n",
" <tr>\n",
" <th>2</th>\n",
" <td>Связанный список</td>\n",
" <td>Cлу ча йный</td>\n",
" <td>0.090039</td>\n",
" <td>0.000893</td>\n",
" <td>0.000605</td>\n",
" </tr>\n",
" <tr>\n",
" <th>3</th>\n",
" <td>Связанный список</td>\n",
" <td>Отсортированный</td>\n",
" <td>0.162447</td>\n",
" <td>0.001707</td>\n",
" <td>0.000915</td>\n",
" </tr>\n",
" <tr>\n",
" <th>4</th>\n",
" <td>Хэш-таблица</td>\n",
" <td>Cлу ча йный</td>\n",
" <td>0.044831</td>\n",
" <td>0.000618</td>\n",
" <td>0.000324</td>\n",
" </tr>\n",
" <tr>\n",
" <th>5</th>\n",
" <td>Хэш-таблица</td>\n",
" <td>Отсортированный</td>\n",
" <td>0.049369</td>\n",
" <td>0.000527</td>\n",
" <td>0.000272</td>\n",
" </tr>\n",
" </tbody>\n",
"</table>\n",
"</div>"
],
"text/plain": [
" Структура Режим Вставка Поиск Удаление\n",
"0 Бинарное дерево Cлу ча йный 0.011921 0.000150 0.000137\n",
"1 Бинарное дерево Отсортированный 0.122171 0.001627 0.000873\n",
"2 Связанный список Cлу ча йный 0.090039 0.000893 0.000605\n",
"3 Связанный список Отсортированный 0.162447 0.001707 0.000915\n",
"4 Хэш-таблица Cлу ча йный 0.044831 0.000618 0.000324\n",
"5 Хэш-таблица Отсортированный 0.049369 0.000527 0.000272"
]
},
"execution_count": 14,
"metadata": {},
"output_type": "execute_result"
}
],
"source": [
"df = pd.read_csv('data/task1/results.csv')\n",
"df.groupby(['Структура', 'Режим'])[['Вставка', 'Поиск', 'Удаление']].mean().reset_index()"
]
},
{
"cell_type": "markdown",
"id": "c9a486a5",
"metadata": {},
"source": [
"# 4. Анализ результатов\n",
"---\n",
"### 4.1 Влияние порядка данных на вставку в BST\n",
"При вставке элементов в отсортированном порядке в бинарное дерево оно превращается в связный список - это связанно с тем, что все элементы вставляются в одну ветвь дерева. Сложность всех операций приблтижается к **O(n)**. Вставка в BST на отсортированных данных заняла 0.122171c вместо 0.011921с , разница более чем в 10 раз. Причём, время вставки даже хуже, чем у чистого связнного списка - это связанно с дополнительными расходами бинарного дерева. Поиск так же ухудшился, примерно в 10 раз, а с ним ухудшилось и удаление.\n",
"\n",
"### 4.2 Почему хэш-таблица почти не чувствительна к порядку\n",
"По графикам видно, что для хэш-таблицы время операций почти не изменяется. Исключение составляет лишь поиск, е г о время больше на отсортированных данных. Это связано с особенностями теста - поиск 10 несуществующих записей ухудшают результат для отсортированных данных. В с е эти наблюдения связаны с механизмом работы хэш-таблицы - она распределяет данные по корзинам независимо от порядка поступления. Получается, что сложность всех операций **O(1)**\n",
"\n",
"### 4.3 Почему связный список всегда медленен при поиске\n",
"Для поиска в связном списке нужно просматривать все элементы по порядку, так что сложность всех операций **O(n)**\n",
"\n",
"### 4.4 Сравнение удаления\n",
"\n",
"- **Связаный список** удаление требует сначала найти элемент за O(n), затем переставить ссылки за O(1). Время удаления (0.000605 с ) близко ко времени поиска, что логично.\n",
"- **Хеш-таблица:** при удалении, поиск корзины за O(1) и поиск в коротком связаном списке за O(n) удаляется элемент. Время удаления (0.000324) меньше, чем в списке.\n",
"- **BST:** на случайных данных удаление очень быстрое (0.000137 с ) благодаря логарифмической высоте. Н а отсортированных данных время возрастает до 0.000873, что отражает деградацию до O(n)."
]
},
{
"cell_type": "markdown",
"id": "a7ed5470",
"metadata": {},
"source": [
"# 5. Вывод\n",
"Н а основе полученных результатов можно сформулировать следующие рекомендации:\n",
"\n",
"- Хеш-таблица – хороший выбор, если приоритетом является максимальная скорость вставки, поиска и удаления по ключу, а порядок элементов не имеет значения. Время операций близко к **O(1)** и практически не зависит от упорядоченности входных данных. Идеальна для кэшей, словарей и частых запросов по идентификатору.\n",
"\n",
"- Двоичное дерево поиска – следует применять, когда необходимо получать данные в отсортированном порядке. Н а случайных данных демонстрирует хорошую производительность **O(log n)**, однако при поступлении заранее отсортированных элементов вырождается в связный список с падением скорости до **O(n)**.\n",
"\n",
"- Связный список – демонстрирует линейную сложность поиска и удаления **O(n)** что делает е г о непригодным для задач с частым доступом к произвольным элементам. Может быть оправдан только в узких случаях, где вставки и удаления происходят исключительно в начале или конце коллекции (очереди, стеки) и не требуется поиск.\n",
"\n",
"Таким образом, для реальных задач чаще всего выбирают хеш-таблицы или сбалансированные деревья в зависимости от требований к упорядоченности данных.\n"
2026-04-05 07:06:28 +00:00
]
2026-03-30 14:47:24 +00:00
}
],
"metadata": {
"kernelspec": {
"display_name": "Python 3",
"language": "python",
"name": "python3"
},
"language_info": {
"codemirror_mode": {
"name": "ipython",
"version": 3
},
"file_extension": ".py",
"mimetype": "text/x-python",
"name": "python",
"nbconvert_exporter": "python",
"pygments_lexer": "ipython3",
2026-05-20 18:23:47 +00:00
"version": "3.14.5"
2026-03-30 14:47:24 +00:00
}
},
"nbformat": 4,
"nbformat_minor": 5
}