Blog

Page 16 - Showing 5 of 88 posts

View all posts by years

Jan 13, 2025

2023中流211保研面经（南软，南大AI，北航cs，东南，浙软等）

2023年中流211保研经验分享，涵盖夏令营和预推免的详细经历。包括北航cs、复旦AI、上交电院等多所高校的考核情况及面试技巧。

🕒2 min read

Dec 4, 2024

B树、B+树

本文探讨了B树和B+树在数据结构中的应用，特别是在处理大量数据和进行高效查询时的优势。首先，文章指出平衡二叉树虽然简单但不适合处理海量数据，因为其高度限制导致磁盘IO次数增多。接着，B树通过在每个节点内部排序来提高读取速度，而B+树则通过将数据存放在叶子节点中并使用链表连接所有叶子节点来减少磁盘IO次数，同时保证查询速度的稳定性。最后，文章提供了参考资料链接，供有兴趣深入了解的读者参考。

🕒1 min read

Dec 4, 2024

常见PEFT方法原理

本文讨论了在大规模通用数据集上训练的LLM模型微调方法，特别是如何通过适配器（Adapter）、前缀（Prefix）和引导词（Prompt）等方法来适应特定任务。特别介绍了微软提出的低秩自适应（LoRA）技术，该方法通过分解更新量矩阵为两个低秩矩阵的乘积来减少运算量，并取得了与全量微调相近的效果。文章还探讨了LoRA的具体原理、应用以及面临的挑战。

🕒1 min read

Jan 11, 2025

荣耀20刷机—–从吃灰到变砖

本文记录了作者尝试将荣耀20手机从鸿蒙系统降级到Magic系统并最终导致设备变砖的整个过程。文章详细描述了刷机前的准备工作、使用的工具和软件，以及在降级过程中遇到的具体问题和挑战。尽管作者投入了大量的时间和金钱，但最终由于操作失误导致手机无法正常使用。

🕒1 min read

Dec 4, 2024

手写多头注意力(MHA)的实现

本文介绍了手写多头注意力（MHA）的实现。文章首先定义了MultiHeadAttention类，该类用于处理多维输入数据并生成输出。在实现过程中，作者详细描述了如何通过线性变换、Scaled Dot-Product Attention和Softmax操作来构建注意力机制。实验结果表明，使用einsum表示法可以简化代码编写，提高可读性。

🕒2 min read

Blog

Tags