External Links: Note Secret Icarus

Weekly Summary 6

Jan 21, 2024 12:30 pm UTC+8

科大高新区

1 本周的工作

  1. Mon:
    1. 和czw讨论a3pim魔改到DFT的可能
    2. overleaf 草稿到10页
    3. rescuetime失效了
  2. Tues:
    1. overleaf 草稿到15页
  3. Wed:
    1. Rescuetime 恢复了,属于记录了,但是没同步显示。
    2. Baidu 毁约打钱。
    3. Overleaf: 草稿到20页 Next:吸收uiCA的观点(前端和重命名寄存器),融入到Arm,重点分析与Intel平台的简化区别。
  4. Thurs:
    1. Overleaf:方法的表述方式,不要是修bug。高级点,扩展点
    2. ACSA年会小结
    3. SAFARI的DATE建议:
      1. StateOfArt 的比较,难以获得代码 (ideal high-level Comparison, to tell the novelty and difference. And the difference of approach)
      2. 15到17年很多文章,2017年类似的SC17
      3. 之前考虑到的缺陷:
        1. 无法处理 程序输入(Program Input)导致的程序行为特点的变化(load store pressure / Memory access locality)
        2. SCA缺失对Mem heirarchy的模拟
      4. 安全的研究,先知道New是什么(比如HMC is new in 2015),再实验。
      5. 危险的研究: 只是对某个领域感兴趣,但是还不知道不同点在哪里。The question is, are you going to find something different? Those type of projects are quite dangerous, because, you’re you don’t know what you’re going to find, or if you’re going to find anything new. and if you don’t find something new is complicated to sell the paper. 23:44
      6. 还没看完
  5. Fri: 不太舒服 chen bai
  6. Sat: 完成了华为报告内容的填充,达到预估的30页的草稿。下周打算将HPCA和THPC的内容翻译并结合进来,然后将缺失的内容补全并润色逻辑,形成一版合并版的草稿。
  7. Sun:
    1. 跑步运动与猝死
    2. 领百度解约函(后续学校和华为处理)
    3. 周报
    4. 问卷修改(论文部分+发布收集)
    5. 学习PS人像(证件照 润色)
    6. AI处理照片 or OFA or birme,部署
metrics Monday Tuesday Wednesday Thursday Friday Saturday Sunday
Get up 8:55 8:55 8:55 8:55 10:45 10:00 10:30
Running x x x x
In-door Exercise(2~3) x x x
Release xx xx x xx
Fall Sleep 3:40 4:00 2:40 4:30 4:00 3:30 3:40
Night Think
Resleep
  1. 室内运动: 建议每半天一次(早起和晚归)。内容仰卧起坐(包括侧卧),平板支撑,俯卧撑,Kegel
  2. 睡觉时间以平板时间为准。
Bootstrap Icons 健康周报
Bootstrap Icons 深夜思考的坏处

2 下周任务优先级

  1. 考虑到繁重的任务量,后续有限的两个月围绕毕业论文展开:敲定了更general的题目后,但是当前对于arch64的设计工作过少,支持不起来题目。
  2. 时间安排:
    1. 需要在快速填充完论文主体内容(一个月)。 Next:吸收uiCA的观点(前端和重命名寄存器),融入到Arm,重点分析与Intel平台的简化区别。
    2. 之后着手进一步来提升精度和Arch64的设计,最终画出more accurate by each step的图(一个月)。
    3. 最后半个月写PPT。准备答辩。
  3. AI for system 5:调研华为DaVinci架构, 国内架构和NV的区别。阅读更多的基础微信公众号。
  4. ACSA Lab website(Before 240131): 创建低配版的网站,收集更多人信息,放假前上线(安老师要求)
    1. 完善问卷:图片要求自行更换背景(或者我手动寻址AI批处理证件照背景,人物位置神色)。论文提供DOI和多媒体链接
  5. 应该没有时间参与到 Workload Priority的工作里了。

3 AI 相关的拓展阅读

https://github.com/chenzomi12/DeepLearningSystem/blob/main/02Hardware/02ChipBase/05.gpu.pdf

3.1 硬件设计

软硬协同优化 (4):指令集设计概述

3.2 AI模型

现在LLM 的大小为什么都设计成6/7B、13B和130B几个档次?解析大模型中的Scaling Law

3.3 瓶颈与性能分析(成本)

Memory Wall in Neural Network Inference

CPU推理

mike: https://le.qun.ch/en/blog/2023/05/13/transformer-batching/

mike: Dissecting Batching Effects in GPT Inference 一个blog你们可能会感兴趣,有GPT inference的内存墙分析

mike: https://www.databricks.com/blog/llm-inference-performance-engineering-best-practices

3.4 国内产品的硬件差距

  1. 国产GPU新势力摩尔线程
  2. 国产GPU,可堪大用吗?系列之二:神秘的910B
  3. 英伟达 vs. 华为海思:GPU性能一览 昇腾910B 达芬奇 gpuScratchpad 思元690 深水4号

3.5 国外先进制程

拆掉英伟达护城河,细节曝光!世界最快超算用3072块AMD GPU训完超万亿参数LLM

3.6 任务评估与时间分配

紧急性(3) 重要性(3) 喜好(1) 工作量(3) 总分 分配 要求
thesis 3 3 0 3 9 三天多 3
AI 1 2 1 2 6 两天欠 1
Worload 1 1 1 1 4 一天多 1
web 1 0 0 1 2 一天欠 1
Summary 21
Bootstrap Icons 提倡多进程工作
Bootstrap Icons HUAWEI 计算产品线
Bootstrap Icons Baidu ai for system
Bootstrap Icons 中文版的周报
Bootstrap Icons Pls correct the grammar and turn this to a weekly report email(not the first time) to Qingcai in easy-understanding english: