向山大概听明白了。/p
或者说,唯一让向山懵逼了一瞬间的,也就是英格丽德举出的那个例子。/p
他没想到会在这种场合听到这种……奇怪的例子。/p
但是,除此之外,好像并没有什么更有价值的东西。/p
只能说,任何专业人士,在超出自己专业领域之后, 就不比一般人更加智慧吧。/p
虽然在英格丽德眼中,这些外星人的书写方式有趣极了,但归根结底,这就是一种压缩算法。/p
而这无法解释向山现在在琢磨的问题。/p
“所有外星机械的设计图纸、装配工艺、材料制造的参数,再加上它们自身运行的ai,加在一块,是如何压缩到两三百mb这个水平的”。/p
外星人使用了两种压缩算法。/p
一种大致可以称作“字典算法”, 即“将高频出现的排列组合用, 做成对应字典, 然后用字典内编号代码来替代该组合”。这种手段人类也在使用。当然,如果“字典”做得很大,那么数据本体就可以压缩得很小。但有些时候,又会形成“字典比数据本体还要大”的情况。/p
外星人大概是选择了一个恰好的数值,保证“本体+字典”的大小最小。/p
另外就是英格丽德所说的这种二维的符号矩阵。/p
但不管怎么样,信息的无损压缩一定是有极限的。/p
而这种二维矩阵的算法,不管外星人将读取规则设计得怎样花里胡哨,它都存在一个“上限”的。/p
就如英嘉所说,如果多增加一个“下一个终止/方向符号无效”的符号,固然可以增加读取路线的数量,但是却会导致符号之中混入大量除了表示“下一个终止/方向符号无效”之外没有其他任何意义的符号, “字典”的集合之中也要增加项目。/p
“读取路线”的增加,会导致“掺杂过多只与读取规则有关的符号”以及“字典”的膨胀。/p
同字典算法一样, 到最后, 同样也会出现“读取规则”大小大于数据本体大小的问题。/p
这里面同样存在一个平衡点。/p
按照向山估计, 关于读取规则的符号可能也就那么几个, 不会太多。/p
而二维的符号矩阵也存在另一个问题。就好像“填字游戏”一样, 一个空间坐标上的符号, 要受到来自四个方向内容的制约。这反而使得信息的表达不像一维的文字那样自由。/p
“就用你举的例子来说吧……”向山是如此说的:“虽然那个古代诗人在八百四十字里面压缩了七千九百五十八首诗,但是我敢肯定,这七千九百、将尽八千首的诗,单独拆出来的话,没有一首可以流传千古吧,说不定还存在那个什么……格律啊韵脚不那么工整的情况。”/p
英格丽德有些好奇:“你看上去好像是刚刚才知道这玩意的……”/p
“如果那个文字游戏里面拆出来的诗足够优秀的话,肯定会上课本。那我肯定会有印象。”向山在这一点上倒是非常确信:“仔细一想,古代多半没有标点符号,断句也得后人来猜……”/p
英格丽德捂脸:“我猜你想说‘句读’。”/p
向山无视了英格丽德的提示:“你看,从这一点来看,这种文字游戏,对信息的压缩,损失很大,效率也就那样。它甚至不是‘压缩任意八千首诗’,以压缩算法的标注来看……嘶……”/p
向山好像意识到了什么……/p
——不是“压缩了任意八千首”……不一定是压缩……/p
——什么……/p
向山似乎是想到了什么。但是那个“什么”的灵感与他一直以来的思维有冲突。这来之不易的点子就这么从向山意识间滑落,消失不见。/p
向山站起来,挠了挠头:“我要说什么来着……”/p
英格丽德坐在凳子上, 抬头看着突然发神经的朋友:“那个……‘以压缩算法的标注来看’?”/p
“以压缩算法的标准来看,这玩意没什么了不得的……”向山继续思索道:“不怕失真的信息……为什么呢……”/p
不……/p
应该说, 这信息绝对不是“不怕失真”的。/p
不然的话,外星人完全可以使用信息密度更高的存储方式,而不是这种符号石板。/p
使用这种符号石板,就意味着那些外星人也非常惧怕意外导致的噪音。他们选择了抗噪性极强而信息密度不高的手段。/p
抗噪性、信息密度、“字典”与“读取顺序规则”与“压缩率”,以及压缩过程中可能丢失的信息……/p
“还是想不明白啊……”向山低声说道。/p
实际上,这个问题几乎困扰了所有留在罗摩项目的人员。/p
这方面的进展几乎停滞了。/p
好在“研究外星遗产”是一个巨大的项目,可以分割为很多的子项目,这方面进度不佳,不影响其他方面取得进展。/p
比如,来自欧洲的研究者们就根据记录下来的“报废机器人最后的位置”,推测“奧贡”在地球降落时所经历的事情。/p
根据模拟计算,这些机器是在很早的时候就已经尽数报废了。但与此同时,奧贡的发动机早就停止工作,整体几乎没有加速度,所以这些报废的机器人就在失重状态下,集中趴在奧贡的后半段,随着这件的流逝而发生微弱的劣化。/p
最后,这些报废的机器人才在人工加速与减速之中激烈碰撞。/p
换言之,这些报废的机器人原本就集中