Pytorch XLA Optimization Guide

Training large-scale deep learning models on TPUs can be a game-changer, but it often comes with its own set of challenges. One of the most common hurdles is achieving optimal performance with PyTorch

2025-10-13

歌与歌词

每到晚上，就有这样一种可以沉入自己世界的机会，少去白天纷杂的事务打扰，可以选择清空念想专注于一些事情包括赋予自己个人的情感体验事实上今天晚上我确实在听歌。歌曲是我重要的组成部分，在我开始听歌的时候，我就无不想要创造属于自己的歌曲，虽然一开始显得有些无从下手，但是只是一点点的进步都会让自己欣喜若狂。从初中开始，我就十分钟爱Yunomi的曲子，大概是2018和2019年的时候开始听的吧，实际

2023-10-20

LLM的逆转诅咒极其正常

今天终于找到短的一点点时间写一下自己的想法。如下是描述了 LLM（大语言模型）经过研究后发现的一个缺点，被称作“逆转诅咒”。主要发现是：如果一个LLM在训练数据中学习到“A是B”这样的句子,它通常不能推导出反方向的“B是A”。比如模型学到“奥拉夫·朔尔茨是德国第九任总理”,但问它“谁是德国第九任总理”时,它不能回答“奥拉夫·朔尔茨”。然后就可以看到各大营销号开始说：啊，LLM被曝重大缺陷！要寄

2023-10-07

时间旅行指南

感觉想到什么写什么会更轻松一点，所以写点吧但是写完才发现，唔，各位不如去直接看霍金的《时间简史》这篇文章涉及到了相对论的知识，所以可能会花很长时间进行理解。别灰心，可以结合各种视频和图像，甚至数学公式，直到掌握它。这篇文章只是我对其的理解，所以可能会有不准确的地方，请包容。应该我们都会有过或多或少类似的想法，就是穿越时空，回到过去去改变一些东西。虽然从因果律上是不太可能的，不过真的不太可能

2023-08-26

语音合成简述

最近在捣鼓 text-to-speech 和 voice-conversion。整个发展史我不是很清楚，所以就写点现有的吧。二阶段模型 (Two-Stage)Tacotron2我一开始接触到的 TTS 应该是 Nvidia 的 Tacotron2。它把文本通过转换生成梅尔频谱 (Mel-Spectrum)，然后用 WaveNet 模型把梅尔频谱还原为音频。音频作为和时间相关的数据也是存在频域和

2023-07-18

关于STRAK原理的记录

STARK基本上是这样[19:20]你有一个想要证明的多项式$P(x)$和条件比如在一定x区间内P在一定范围[19:20]然后用条件多项式让满足的x可算出C(P(x))=0[19:21]接下来用另一个指定x范围的多项式Z(x)=(x-1)(x-2)…[19:21]C范围也可以是C(x)=(x-1)(x-2)[19:21]然后在x满足条件的时候我们就能知道C(P(x))

2023-04-14

picoCTF 2023 msfroggenerator2 writeup

第一次参加CTF，这个题花了我四天解出来，好难啊这是一道web题，好像和 corCTF 之前那个 msfroggenerator 是联动的，哈哈corCTF flag那个有提到 should have rendered client side ，这回总算实现了总而言之，这道题考察了对浏览器各种特性的熟悉程度，和后端服务的熟悉程度。综合能力比较强，我给它打一百昏 Overview首先看源码的

2023-03-29

一些量子计算的东西

前几天看到一个有趣的东西，这篇文章在尝试寻找大脑用了某些量子相关的东西的证据。大概就是用已知的量子系统去干涉未知系统，如果两个系统成功发生了纠缠，就可以认为未知系统是非经典的。这就比较有意思了，某种程度上来说给了人工神经网络启发。

2022-11-14

Pixivel 的推荐系统是怎么运作的？

Pixivel 这个项目，大概已经存在了三年甚至四年之久了。这是我唯一一个维护的大型网站（对我来说），也是凝聚了我们众多心血的地方。在此期间，她经历了三次版本大改，无数次的增量迭代。现在的后端和前端系统，我敢说已经十分的健壮，并且已经积累了惊人的用户量。

2022-07-23

在基于Substrate的区块链上写智能合约

这几天按耐不住就是要折腾区块链，所以又用 Substrate 起了条链。使用 Substrate 主要是被它的设计吸引了，通过 Runtime 和 Node 分离，Runtime 功能又通过 Pallet 实现，极大程度的降低了耦合度，使得可以通过它开发出任意区块链。

2022-07-17