相关文章
DeepSeek v3 技术报告阅读笔记
注 本文参考 DeepSeek-v3 / v2 / v1 Technical Report 及相关参考模型论文本文不包括基础的知识点讲解,为笔记/大纲性质而非教程,建议阅读技术报告原文交流可发送至邮箱 henryhua0721foxmail.com 架构核心
核心:
MLA 高效推理DeepSeekMOE 更…
建站知识
2025/3/15 9:42:46
新数据结构(11)——Java类的产生和反射
反射是获取类信息的一种能力
类信息包括属性、方法、构造器、父类、接口等
类信息的来源
来自类的加载器,这是从.class文件到内存中的java虚拟器(JVM)中间的一个阶段(如下图) 类的加载器里,用Field数组存…
建站知识
2025/3/15 13:26:49
C语言题目:链表数据求和操作
题目描述
读入10个复数,建立对应链表,然后求所有复数的和。
输入格式
无
输出格式
无
样例输入
1 2
1 3
4 5
2 3
3 1
2 1
4 2
2 2
3 3
1 1
样例输出
2323i 代码功能概述 createNode 函数: 创建一个包含 10 个复数节点的链表。 每个…
建站知识
2025/3/15 13:26:52
网络安全“挂图作战“及其场景
文章目录 一、网络安全挂图作战来源与定义1、网络安全挂图作战的来源2、网络安全挂图作战的定义 二、挂图作战关键技术三、挂图作战与传统态势感知的差异四、挂图作战主要场景五、未来趋势结语 一、网络安全挂图作战来源与定义
1、网络安全挂图作战的来源
网络安全挂图作战的…
建站知识
2025/3/15 13:10:30
从零开始构建一个小型字符级语言模型的详细教程(基于Transformer架构)之二模型架构设计
最近特别火的DeepSeek,是一个大语言模型,那一个模型是如何构建起来的呢?DeepSeek基于Transformer架构,接下来我们也从零开始构建一个基于Transformer架构的小型语言模型,并说明构建的详细步骤及内部组件说明。我们以构建一个字符级语言模型(Char-Level LM)为例,目标是通…
建站知识
2025/3/15 13:19:46
Spring框架-AOP
1. 代理模式
为某一个对象(委托类)提供一个代理(代理类),用来控制对这个对象的访问。委托类和代理类有一个共同的父类或父接口。
代理类会对请求做预处理、过滤、将请求分配给指定对象。
生活中常见的代理模式&…
建站知识
2025/3/15 13:17:28
iOS 获取设备占用内存
获取应用占用内存
获取应用进程占用内存
- (NSUInteger)memoryUsage {task_vm_info_data_t vmInfo;mach_msg_type_number_t count TASK_VM_INFO_COUNT;kern_return_t result task_info(mach_task_self(), TASK_VM_INFO, (task_info_t)&vmInfo, &count);if (result …
建站知识
2025/3/15 12:56:22
AI 安全时代:SDL与大模型结合的“王炸组合”——技术落地与实战指南
引言:AI安全的现实挑战
根据MITRE 2023年AI安全报告,全球62%的企业在部署大模型时遭遇过安全事件(如数据泄露、模型滥用),而 欧盟《AI法案》 明确要求高风险AI系统必须通过全生命周期安全管理认证。本文将基于行业权威…
建站知识
2025/3/15 12:58:42