[1] lab1

2026-05-20 22:05:27 +03:00 · 2026-05-20 22:05:27 +03:00 · d71206b9b0
commit d71206b9b0
parent e71fe47f8c
1 changed files with 475 additions and 0 deletions
--- a/shekurovaa/1/docs/data/zad1.py
+++ b/shekurovaa/1/docs/data/zad1.py
@ -0,0 +1,475 @@
+import time
+import random
+import csv
+import os
+import sys
+from dataclasses import dataclass, field
+from typing import Optional, List, Tuple, Any
+
+import matplotlib.pyplot as plt
+
+sys.setrecursionlimit(20000)
+
+BASE_PATH = r"C:\Users\andre\2026-rff_mp\smirnovad\lab1"
+DOCS_PATH = os.path.join(BASE_PATH, "docs")
+DATA_PATH = os.path.join(DOCS_PATH, "data")
+
+for path in (DOCS_PATH, DATA_PATH):
+    os.makedirs(path, exist_ok=True)
+
+N = 10_000
+REPEATS = 5
+FOUND_SAMPLE_SIZE = 100
+NOT_FOUND_SAMPLE_SIZE = 10
+DELETE_SAMPLE_SIZE = 50
+
+@dataclass
+class NodeLL:
+    """Узел односвязного списка."""
+    key: str
+    value: Any
+    next: Optional["NodeLL"] = None
+
+
+class LinkedList:
+    """Односвязный список с вставкой в начало."""
+
+    def __init__(self) -> None:
+        self.head: Optional[NodeLL] = None
+
+    def insert(self, key: str, value: Any) -> None:
+        self.head = NodeLL(key, value, self.head)
+
+    def find(self, key: str) -> Any:
+        cur = self.head
+        while cur is not None:
+            if cur.key == key:
+                return cur.value
+            cur = cur.next
+        return None
+
+    def delete(self, key: str) -> None:
+        cur = self.head
+        prev: Optional[NodeLL] = None
+
+        while cur is not None:
+            if cur.key == key:
+                if prev is None:
+                    self.head = cur.next
+                else:
+                    prev.next = cur.next
+                return
+            prev = cur
+            cur = cur.next
+
+    def items(self) -> List[Tuple[str, Any]]:
+        res: List[Tuple[str, Any]] = []
+        cur = self.head
+        while cur is not None:
+            res.append((cur.key, cur.value))
+            cur = cur.next
+        return sorted(res)
+
+
+@dataclass
+class NodeBST:
+    """Узел бинарного дерева поиска."""
+    key: str
+    value: Any
+    left: Optional["NodeBST"] = None
+    right: Optional["NodeBST"] = None
+
+
+class BST:
+    """Бинарное дерево поиска (без балансировки)."""
+
+    def __init__(self) -> None:
+        self.root: Optional[NodeBST] = None
+
+    def insert(self, key: str, value: Any) -> None:
+        self.root = self._insert(self.root, key, value)
+
+    def _insert(self, node: Optional[NodeBST], key: str, value: Any) -> NodeBST:
+        if node is None:
+            return NodeBST(key, value)
+        if key < node.key:
+            node.left = self._insert(node.left, key, value)
+        elif key > node.key:
+            node.right = self._insert(node.right, key, value)
+        else:
+            node.value = value
+        return node
+
+    def find(self, key: str) -> Any:
+        return self._find(self.root, key)
+
+    def _find(self, node: Optional[NodeBST], key: str) -> Any:
+        if node is None:
+            return None
+        if key == node.key:
+            return node.value
+        if key < node.key:
+            return self._find(node.left, key)
+        return self._find(node.right, key)
+
+    def delete(self, key: str) -> None:
+        self.root = self._delete(self.root, key)
+
+    def _delete(self, node: Optional[NodeBST], key: str) -> Optional[NodeBST]:
+        if node is None:
+            return None
+        if key < node.key:
+            node.left = self._delete(node.left, key)
+        elif key > node.key:
+            node.right = self._delete(node.right, key)
+        else:
+            if node.left is None:
+                return node.right
+            if node.right is None:
+                return node.left
+            succ = node.right
+            while succ.left is not None:
+                succ = succ.left
+            node.key, node.value = succ.key, succ.value
+            node.right = self._delete(node.right, succ.key)
+        return node
+
+    def items(self) -> List[Tuple[str, Any]]:
+        res: List[Tuple[str, Any]] = []
+        self._inorder(self.root, res)
+        return res
+
+    def _inorder(self, node: Optional[NodeBST], out: List[Tuple[str, Any]]) -> None:
+        if node is None:
+            return
+        self._inorder(node.left, out)
+        out.append((node.key, node.value))
+        self._inorder(node.right, out)
+
+
+class HashTable:
+    """Хеш-таблица с цепочками (односвязные списки)."""
+
+    def __init__(self, capacity: int = 1024) -> None:
+        self.capacity = capacity
+        self.buckets: List[Optional[LinkedList]] = [None] * capacity
+
+    def _index(self, key: str) -> int:
+        return hash(key) % self.capacity
+
+    def insert(self, key: str, value: Any) -> None:
+        idx = self._index(key)
+        bucket = self.buckets[idx]
+        if bucket is None:
+            bucket = LinkedList()
+            self.buckets[idx] = bucket
+        bucket.insert(key, value)
+
+    def find(self, key: str) -> Any:
+        idx = self._index(key)
+        bucket = self.buckets[idx]
+        if bucket is None:
+            return None
+        return bucket.find(key)
+
+    def delete(self, key: str) -> None:
+        idx = self._index(key)
+        bucket = self.buckets[idx]
+        if bucket is None:
+            return
+        bucket.delete(key)
+
+    def items(self) -> List[Tuple[str, Any]]:
+        res: List[Tuple[str, Any]] = []
+        for bucket in self.buckets:
+            if bucket is not None:
+                res.extend(bucket.items())
+        return sorted(res)
+
+def generate_records(n: int) -> List[Tuple[str, str]]:
+    """Генерирует список (имя, телефон)."""
+    raw = [(f"user_{i:05d}", f"8-900-{random.randint(100, 999)}") for i in range(n)]
+    return raw
+
+
+def prepare_datasets(n: int) -> dict:
+    """Подготавливает наборы данных: случайный и отсортированный."""
+    raw = generate_records(n)
+    shuffled = raw[:]
+    random.shuffle(shuffled)
+    sorted_data = sorted(raw, key=lambda x: x[0])
+    return {
+        "случайный": shuffled,
+        "сортированный": sorted_data,
+    }
+
+@dataclass
+class RunResult:
+    struct_name: str
+    mode: str
+    run_label: str
+    insert_time: float
+    find_time: float
+    delete_time: float
+
+
+class BenchmarkRunner:
+    def __init__(self, repeats: int = REPEATS) -> None:
+        self.repeats = repeats
+        self.results: List[RunResult] = []
+
+    def run_experiment(self, struct_name: str, mode: str, data: List[Tuple[str, str]]) -> None:
+        print(f"Запуск: {struct_name} ({mode})")
+
+        insert_times: List[float] = []
+        find_times: List[float] = []
+        delete_times: List[float] = []
+
+        for rep in range(self.repeats):
+            if struct_name == "LinkedList":
+                container = LinkedList()
+            elif struct_name == "HashTable":
+                container = HashTable(capacity=1024)
+            elif struct_name == "BST":
+                container = BST()
+            else:
+                raise ValueError(f"Неизвестная структура: {struct_name}")
+
+            t0 = time.perf_counter()
+            for key, val in data:
+                container.insert(key, val)
+            insert_times.append(time.perf_counter() - t0)
+
+            found_keys = [d[0] for d in random.sample(data, FOUND_SAMPLE_SIZE)]
+            not_found_keys = [f"nonexistent_{j}" for j in range(NOT_FOUND_SAMPLE_SIZE)]
+            search_keys = found_keys + not_found_keys
+
+            t0 = time.perf_counter()
+            for k in search_keys:
+                container.find(k)
+            find_times.append(time.perf_counter() - t0)
+
+            delete_keys = [d[0] for d in random.sample(data, DELETE_SAMPLE_SIZE)]
+            t0 = time.perf_counter()
+            for k in delete_keys:
+                container.delete(k)
+            delete_times.append(time.perf_counter() - t0)
+
+            self.results.append(
+                RunResult(
+                    struct_name=struct_name,
+                    mode=mode,
+                    run_label=f"run_{rep+1}",
+                    insert_time=insert_times[-1],
+                    find_time=find_times[-1],
+                    delete_time=delete_times[-1],
+                )
+            )
+
+        avg_ins = sum(insert_times) / self.repeats
+        avg_find = sum(find_times) / self.repeats
+        avg_del = sum(delete_times) / self.repeats
+
+        self.results.append(
+            RunResult(
+                struct_name=struct_name,
+                mode=mode,
+                run_label="AVG",
+                insert_time=avg_ins,
+                find_time=avg_find,
+                delete_time=avg_del,
+            )
+        )
+
+    def save_csv(self, path: str) -> None:
+        with open(path, "w", newline="", encoding="utf-8") as f:
+            w = csv.writer(f)
+            w.writerow(["Структура", "Режим", "Итерация", "Вставка", "Поиск", "Удаление"])
+            for r in self.results:
+                w.writerow([
+                    r.struct_name,
+                    r.mode,
+                    r.run_label,
+                    r.insert_time,
+                    r.find_time,
+                    r.delete_time,
+                ])
+
+    def summary(self) -> List[dict]:
+        """Возвращает список словарей со средними по (структура, режим)."""
+        summary = []
+        groups: dict = {}
+        for r in self.results:
+            if r.run_label != "AVG":
+                continue
+            key = (r.struct_name, r.mode)
+            groups[key] = {
+                "name": r.struct_name,
+                "mode": r.mode,
+                "ins": r.insert_time,
+                "find": r.find_time,
+                "del": r.delete_time,
+            }
+        summary.extend(groups.values())
+        return summary
+
+
+def build_plots(summary: List[dict], n: int, path_base: str) -> None:
+    structs = ["LinkedList", "HashTable", "BST"]
+    ops = ["insert", "find", "delete"]
+    op_keys = ["ins", "find", "del"]
+    colors_struct = {
+        "LinkedList": "#5dade2",
+        "HashTable": "#e67e22",
+        "BST": "#58d68d",
+    }
+
+    fig1, axs = plt.subplots(1, 3, figsize=(18, 6))
+    fig1.suptitle("Влияние порядка данных на время операций", fontsize=16, fontweight="bold")
+
+    labels_ops = ["insert", "find", "delete"]
+    width = 0.35
+    x = [0, 1, 2]
+
+    for i, s_name in enumerate(structs):
+        rand_row = next(
+            (r for r in summary if r["name"] == s_name and r["mode"] == "случайный"),
+            None,
+        )
+        sort_row = next(
+            (r for r in summary if r["name"] == s_name and r["mode"] == "сортированный"),
+            None,
+        )
+        if rand_row is None or sort_row is None:
+            continue
+
+        vals_rand = [rand_row["ins"], rand_row["find"], rand_row["del"]]
+        vals_sort = [sort_row["ins"], sort_row["find"], sort_row["del"]]
+
+        axs[i].bar(
+            [p - width / 2 for p in x],
+            vals_rand,
+            width,
+            label="случайный",
+            color=colors_struct[s_name],
+        )
+        axs[i].bar(
+            [p + width / 2 for p in x],
+            vals_sort,
+            width,
+            label="сортированный",
+            color="#e74c3c",
+            alpha=0.85,
+        )
+
+        axs[i].set_title(s_name, fontweight="bold")
+        axs[i].set_xticks(x)
+        axs[i].set_xticklabels(labels_ops)
+        axs[i].set_ylabel("Время (с)")
+        axs[i].legend()
+        axs[i].grid(axis="y", linestyle="--", alpha=0.3)
+
+    plt.tight_layout(rect=[0, 0.03, 1, 0.95])
+    plt.savefig(os.path.join(path_base, "order_impact.png"))
+    plt.close(fig1)
+
+    fig2, axs2 = plt.subplots(1, 3, figsize=(18, 6))
+    fig2.suptitle(f"Сравнение структур данных (N={n})", fontsize=16, fontweight="bold")
+
+    for i, op_key in enumerate(op_keys):
+        plot_labels = []
+        plot_values = []
+        plot_colors = []
+
+        for r in summary:
+            plot_labels.append(f"{r['name']}\\n({r['mode'][:4]})")
+            plot_values.append(r[op_key])
+            plot_colors.append(colors_struct[r["name"]])
+
+        bars = axs2[i].bar(plot_labels, plot_values, color=plot_colors)
+        axs2[i].set_title(f"Операция: {ops[i]}", fontweight="bold")
+        axs2[i].set_ylabel("Время (с)")
+        axs2[i].tick_params(axis="x", rotation=15)
+
+        for bar in bars:
+            h = bar.get_height()
+            axs2[i].text(
+                bar.get_x() + bar.get_width() / 2,
+                h,
+                f"{h:.4f}",
+                ha="center",
+                va="bottom",
+                fontsize=8,
+            )
+
+    plt.tight_layout(rect=[0, 0.03, 1, 0.95])
+    plt.savefig(os.path.join(path_base, "struct_comparison.png"))
+    plt.close(fig2)
+
+
+def build_report(summary: List[dict], n: int, path: str) -> None:
+    lines = []
+    lines.append("# Технический отчет: Сравнительный анализ структур данных\n")
+    lines.append("## 1. Вводные данные\n")
+    lines.append(
+        f"Цель — оценить производительность LinkedList, HashTable и BST на массиве из {n} элементов. "
+        "Рассмотрены два сценария: случайный порядок ключей и заранее отсортированный по возрастанию.\n"
+    )
+
+    lines.append("## 2. Результаты измерений (среднее)\n")
+    lines.append("| Структура | Режим | Вставка (с) | Поиск (с) | Удаление (с) |\n")
+    lines.append("| :--- | :--- | :---: | :---: | :---: |\n")
+    for r in summary:
+        lines.append(
+            f"| {r['name']} | {r['mode']} | {r['ins']:.6f} | {r['find']:.6f} | {r['del']:.6f} |\n"
+        )
+
+    lines.append("\n## 3. Визуализация\n")
+    lines.append("### Сравнение структур по операциям\n")
+    lines.append("![Сравнение структур](data/struct_comparison.png)\n")
+    lines.append("### Влияние порядка данных\n")
+    lines.append("![Влияние порядка](data/order_impact.png)\n")
+
+    lines.append("## 4. Выводы\n")
+    lines.append(
+        "- **BST без балансировки** на отсортированных ключах вырождается в линейную цепочку, "
+        "что приводит к резкому росту времени операций (практическая сложность приближается к $O(N)$).\n"
+    )
+    lines.append(
+        "- **HashTable** показывает стабильную производительность, практически не зависящую от порядка входных данных. "
+        "Это делает её предпочтительной для задач с интенсивным поиском и вставкой.\n"
+    )
+    lines.append(
+        "- **LinkedList**ónico предсказуемо медленен при поиске и удалении, так как эти операции требуют линейного прохода по списку.\n"
+    )
+    lines.append(
+        "- **Итог:** для систем с высокой нагрузкой на поиск/вставку оптимальным выбором является хеш-таблица; "
+        "BST имеет смысл использовать только при дополнительной балансировке (AVL, красно-черное дерево и т.п.).\n"
+    )
+
+    with open(path, "w", encoding="utf-8") as f:
+        f.writelines(lines)
+
+
+
+def main() -> None:
+    datasets = prepare_datasets(N)
+    runner = BenchmarkRunner(repeats=REPEATS)
+
+    for mode_name, data in datasets.items():
+        for struct_name in ["LinkedList", "HashTable", "BST"]:
+            runner.run_experiment(struct_name, mode_name, data)
+
+    csv_path = os.path.join(DATA_PATH, "results.csv")
+    runner.save_csv(csv_path)
+
+    summary = runner.summary()
+
+    build_plots(summary, N, DATA_PATH)
+    build_report(summary, N, os.path.join(DOCS_PATH, "report.md"))
+
+    print("Готово.")
+
+
+if __name__ == "__main__":
+    main()