歌与歌词 每到晚上,就有这样一种可以沉入自己世界的机会,少去白天纷杂的事务打扰,可以选择清空念想专注于一些事情 包括赋予自己个人的情感体验 事实上今天晚上我确实在听歌。歌曲是我重要的组成部分,在我开始听歌的时候,我就无不想要创造属于自己的歌曲,虽然一开始显得有些无从下手,但是只是一点点的进步都会让自己欣喜若狂。 从初中开始,我就十分钟爱Yunomi的曲子,大概是2018和2019年的时候开始听的吧,实际 2023-10-20
LLM的逆转诅咒极其正常 今天终于找到短的一点点时间写一下自己的想法。 如下是描述了 LLM(大语言模型)经过研究后发现的一个缺点,被称作“逆转诅咒”。 主要发现是:如果一个LLM在训练数据中学习到“A是B”这样的句子,它通常不能推导出反方向的“B是A”。比如模型学到“奥拉夫·朔尔茨是德国第九任总理”,但问它“谁是德国第九任总理”时,它不能回答“奥拉夫·朔尔茨”。然后就可以看到各大营销号开始说:啊,LLM被曝重大缺陷!要寄 2023-10-07
时间旅行指南 感觉想到什么写什么会更轻松一点,所以写点吧但是写完才发现,唔,各位不如去直接看霍金的《时间简史》 这篇文章涉及到了相对论的知识,所以可能会花很长时间进行理解。别灰心,可以结合各种视频和图像,甚至数学公式,直到掌握它。这篇文章只是我对其的理解,所以可能会有不准确的地方,请包容。 应该我们都会有过或多或少类似的想法,就是穿越时空,回到过去去改变一些东西。虽然从因果律上是不太可能的,不过真的不太可能 2023-08-26
语音合成简述 最近在捣鼓 text-to-speech 和 voice-conversion。整个发展史我不是很清楚,所以就写点现有的吧。 二阶段模型 (Two-Stage)Tacotron2我一开始接触到的 TTS 应该是 Nvidia 的 Tacotron2。它把文本通过转换生成梅尔频谱 (Mel-Spectrum),然后用 WaveNet 模型把梅尔频谱还原为音频。 音频作为和时间相关的数据也是存在频域和 2023-07-18
关于STRAK原理的记录 STARK基本上是这样[19:20]你有一个想要证明的多项式$P(x)$和条件比如在一定x区间内P在一定范围[19:20]然后用条件多项式让满足的x可算出C(P(x))=0[19:21]接下来用另一个指定x范围的多项式Z(x)=(x-1)(x-2)…[19:21]C范围也可以是C(x)=(x-1)(x-2)[19:21]然后在x满足条件的时候我们就能知道C(P(x)) 2023-04-14
picoCTF 2023 msfroggenerator2 writeup 第一次参加CTF,这个题花了我四天解出来,好难啊 这是一道web题,好像和 corCTF 之前那个 msfroggenerator 是联动的,哈哈corCTF flag那个有提到 should have rendered client side ,这回总算实现了 总而言之,这道题考察了对浏览器各种特性的熟悉程度,和后端服务的熟悉程度。综合能力比较强,我给它打一百昏 Overview首先看源码的 2023-03-29
一些量子计算的东西 前几天看到一个有趣的东西,这篇文章在尝试寻找大脑用了某些量子相关的东西的证据。大概就是用已知的量子系统去干涉未知系统,如果两个系统成功发生了纠缠,就可以认为未知系统是非经典的。这就比较有意思了,某种程度上来说给了人工神经网络启发。 2022-11-14
Pixivel 的推荐系统是怎么运作的? Pixivel 这个项目,大概已经存在了三年甚至四年之久了。这是我唯一一个维护的大型网站(对我来说),也是凝聚了我们众多心血的地方。在此期间,她经历了三次版本大改,无数次的增量迭代。现在的后端和前端系统,我敢说已经十分的健壮,并且已经积累了惊人的用户量。 2022-07-23
在基于Substrate的区块链上写智能合约 这几天按耐不住就是要折腾区块链,所以又用 Substrate 起了条链。使用 Substrate 主要是被它的设计吸引了,通过 Runtime 和 Node 分离,Runtime 功能又通过 Pallet 实现,极大程度的降低了耦合度,使得可以通过它开发出任意区块链。 2022-07-17
自己整了个ACT模考页 主要是做了个网页目前在考TOEFL和ACT。TOEFL的题目和模考软件是一抓一大把,但是ACT迟迟没有个像样的模考软件。那我就自己做一个吧,也不难,毕竟已经考过一次知道它的界面是啥样了。 2022-05-18