系统性能分析方法
从 X86 到 ARM 的业务迁移,系统性能问题排查的通用方法。
从 X86 到 ARM 的业务迁移,系统性能问题排查的通用方法。
2025 年的生活、工作与 AI Agent 使用感受。
从 WordPress 迁到 Jekyll + GitHub Pages 的过程记录。
先上一张大图,nviDIA官方文档的编译流程图
0. 参考文献
TensorFlow 源码编译构建 大型工程编译坑还是太多,这波先把坑给大家踩一踩。
计算掩盖IO的延迟 例如 像 transpose 这种访存相关的操作,我们通过对一个特殊的矩阵乘,进行一次转换,达到transpose的结果,而非从片外存储中,来进行load。 矩阵分块与合并 进行与硬件的规格相匹配,例如GPU 中 w...
https://stackoverflow.com/questions/75191/what-is-an-unsigned-char
CRC32是什么?
Reference
编译器的几个阶段
1.关于ARM 中 memory model的一些理解
概念理解
Caffe install in alios7
DUMP HLO 和 NLO的dot图,便于查看XLA PASS间是否做了对应转换
起因是 云智能的安全考试有一题,如下图所示:
虚拟机是一种高级抽象,对于原生操作系统来说,模拟了物理机。
PGO 是 Profile Guided Optimization 的缩写,主要是用sampling的方法,对应用程序进行剖析,得到分析的数据,然后反馈给下一次编译。
Reference
科比逝去的阴云仍然笼罩在NBA与球迷的心间,而像鲁迅曾写到的那样”亲戚或余悲,他人亦已歌”,过不了多久就会一切如常,时间总会让一切慢慢平息。
今天是大年初三,新型冠状病毒肺炎疫情的隔离期间,气氛一直处于恐慌压抑的状态。
实际上这个坑留的有点大,如果从计算机理论的起源来讲的话,就是图灵机了,会讨论一些比较抽象的概念,例如可计算性和计算复杂性,当时这门课以70分结束,其实还是一知半解的;推荐一部 图灵的传记电影《The Imitation Game》,这还是一个非计算机专业的妹子推荐给我的,由卷福出演。
代码优先级
Reference
Overview
最近投入到搜索推荐相关业务加速中,记录一些常见的关键词。
今日中秋,未尽团圆之意,明月照常升起,天涯共此时。
读取一张jpg图片(压缩格式)
https://2019fbwc.damai.cn/prices
Reference
Caffe install in RadHat
const的作用 const是C语言的一种关键字,起受保护,防止以外的变动的作用!可以修饰变量,参数,返回值,甚至函数体。const可以提高程序的健壮性,你只管用到你想用的任何地方。
https://mp.weixin.qq.com/s/F_VvLTWfg-COZKrQAtOSwg
ROI Pooling
宏定义 描述文件 zzz.md
问题分析
最近遇到了类型转换的问题,记录一下
0.下载Nvidia驱动
darknet接口设计思路
GPGPU-Sim 1 环境搭建
GPGPU-Sim 纵览
C与CUDA混合编译动态链接文件.so
作为标准数据集,voc-2007 是衡量图像分类识别能力的基准,faster-rcnn,yolo -v1, yolo-v2都以此数据集作为演示样例。 数据集的组成架构如下:
SSD(Single Shot MultiBox Detector)算是一个比较不错的目标检测算法,主攻方向是速度,当然精度也比Yolo提高了一些,最近在ubuntu16.04下实现了代码运行,此博文主要内容来自原作者的github,加上了一些个人理解,欢迎探讨。 **PS:SSD代码和模型常常在更新,我给的链接...
yolo训练日志
cudnn Installation in Linux
(旧站点迁移)
Jetson tx2 性能模式工具nvpmodel
GOTURN安装教程
caffe - goturn 安装问题汇总
0.SSD测试时出现 ```
1. tools
Effective C++ 之 类型转换
How to calculate occupancy
为了使用Ubuntu 的远程桌面,做了很多尝试,只有使用 xfce4 结合 vnc 可以使用
Zero copy in TK1and TX1 and TX2
concurrent kernel and dynamic parallelism
PTX ISA Special Registers
GPGPU-Sim ispass2009 编译问题0
C++ 垃圾回收 智能指针shared_ptr
GPGPU-Sim 笔记整理 0
Main 函数原型
Launch Bounds
CUDA L1 Cache/shared memory 配置函数
GPGPU-Sim笔记整理 cache
Control Flow Instructions
CUDA 基本概念理解
CUDA-MEMCHECK
Compute Capability 2.x Fermi Arch
Jetson TK1 刷机步骤小记
cuda binary
PTX ISA—同步指令