百度360必应搜狗淘宝本站头条
当前位置:网站首页 > 技术文章 > 正文

信息传输背后的数学

cac55 2025-03-05 13:43 18 浏览 0 评论

我们每天都在发送信息, 无论是给亲人的短信、给朋友的电子邮件, 还是那些古老的电报.然而, 令人惊讶的是, 很少会有人问:“这些存储在云端的数据是怎样以如此清晰和快速的方式传输的?”也许借助物理学, 我们可以推测消息是通过波传输的. 然而, 这并不足以解释数据是如何以高准确度传输的.因为凭直觉, 沿着非真空介质传播的波很可能会经历扰动, 这将引入错误的传输数据.此外, 这些扰动可能是不可逆的, 也就是说, 波不会经历自我修正的机制.因此, 主要的问题是:数据是怎样以如此高的保真度传输的?换句话说, 我们每天是如何享受如此迅速而准确的通信方式的?

消息、信息和数据

事实证明, 所有这些数据或信息传输背后都有一个基础的数学理论. 从互联网到智能设备的数据传输就是一个具体例子, 这是一种从一个点到另一个点的更一般、更抽象的数据传输概念. 在这里, 点可以是发送方(即信息源)或接收方(即目的地), 例如卫星或手机.

在这一通用的信息传输模型中, 发送方首先将信息或消息发送给编码器, 编码器随后通过使用合适的数学结构对消息进行编码. 一个具有历史意义的例子是使用二进制数字(比特), 即0和1, 来编码黑白图像. 在这种编码技术中(NASA在1960年代实施), 图像被划分为等大小的方块, 每个方块要么是完全黑色, 要么是完全白色;编码器用数字1表示每个黑色方块, 用0表示每个白色方块, 从而有效地产生了一组1和0(在数学术语中称为关联矩阵(Incidence matrix)).

编码后的下一个步骤是将编码的信息(我们称之为数据)传输到接收方. 在此过程中, 数据通过介质或通道传输——在卫星的情况下, 可能是大气层和靠近地球表面的银河区域——到达接收端. 最后, 接收端对数据进行解码, 即执行编码器对信息所做的反操作. 这样, 接收方就获得了原始信息. 如图1简要描述了这一过程.

消息传输系统无疑应该更复杂, 否则, 我们肯定会质疑, 从事这一领域的数学家或工程师究竟是如何赚取薪水的.上述模型中存在两个固有的问题. 首先, 你可能已经从波扰动的例子中意识到, 通道会向数据中引入扰动或噪声.这会影响传输数据的准确性或可靠性(见图2中的A). 其次, 参考NASA的例子, 有时无法100%准确地用数学结构表示图像或信息.这就产生了我们所称的信息失真(见图2中的B).

这些问题是否得到了解决或妥善处理?答案是肯定的, 但还不是完全解决(确实很棘手!). 关于第一个问题, 也称为通道编码问题, 数学家们发现, 通过添加一些与传输数据无关的额外元素(在数学术语中称为冗余), 可以降低噪声影响数据保真度的概率. 这些冗余使数据对不可逆的或永久的扰动不那么敏感, 从而提高数据的准确性. 然而, 这会降低数据传输的速度, 因为发送方必须在每个时刻都通过通道发送额外的冗余. 最终, 必须在速度和准确性之间做出妥协, 但我们能达到的最佳妥协是什么呢?

让我们在考虑第二个问题(源编码问题)时牢记这个问题. 在通过数学结构表示我们的消息时, 我们必须使用一组符号来封装其各个不同的元素. 显然, 我们希望完整地捕捉信息而不失真, 但这需要使用更多的符号. 工程师对此非常关注, 因为他们的目标是使用尽可能少的符号,尽可能多地压缩信息. 因此, 必须做出妥协, 选择最佳妥协的问题再次浮出水面.

香农的通信理论

1948年, 数学家克劳德·艾尔伍德·香农(Claude Elwood Shannon)发表了两篇论文, 统称为《通信的数学理论》, 描述并分析了一种信息传输的通用的数学模型——实际上就是我们所描述的模型. 香农证明了数据传输速率和信息压缩程度存在基本限制. 也就是说, (i) 超过某个速率, 数据传输必然变得不可靠;(ii) 低于某个数据压缩水平(即使用尽可能少的符号), 信息必然会失真.

现在, 这些发现乍一看似乎显而易见, 但如果我们稍加深入, 就会意识到它们实际上是多么迷人. 首先, 香农利用概率理论中的思想, 深入探讨了一些数学细节. 他将发送者和发射器各自建模为一个随机变量, 每次生成一个特定元素时, 都会以某个特定的概率生成该元素. 接下来, 他巧妙地制定了一种数学度量, 来衡量消息中所含信息的量, 他称之为. 换句话说, 如果我们用随机变量X表示发射器, 那么有一个函数H, 当应用于X时会得到H(X), 这就是X的熵.

这个H(X)具有非常强大的性质, 因此, 香农建立了以下有趣的事实.

  • H(X)是信息源X在不遭受不可避免失真的情况下, 数据压缩的极限度量. 换句话说, 你的信息内容或熵越高, 就越无法压缩.

  • H函数的思想可以良好地扩展, 得出一个称为互信息(mutual information)的数学表达式. 令人意外的是, 这个互信息的值是通过通道进行可靠数据传输的极限度量. 换句话说, 互信息越高, 可靠数据传输的最大速率就越大.

此外, 虽然在计算出的互信息值以上, 数据传输会变得不可靠, 但在该值以下, 任意可靠的通信水平是可以实现的. 也就是说, 可以选择在数据传输过程中允许的特定错误程度(由噪声引起), 并且总有一个低于互信息的相应速率, 使得错误恰好达到该程度. 同样, 在熵以上的任何压缩水平上, 也可以实现任意小程度的信息失真. 或许所有这些都与我们直觉上认为的不可靠性(失真程度)与速率(压缩水平)之间是连续关系的看法相悖;实际上, 对于压缩和速率都有非常明确的阈值, 超过这些阈值将导致灾难.

我们的问题解决了吗?

考虑到香农的智力成就, 我们可能会认为通信的两个基本问题已经完全解决. 不幸的是, 我们离解决这些问题还很远.大多数人并不知道, 数学家和工程师们正在积极而持续地寻找实现压缩和速率极限的方法. 确实, 了解基本极限是一回事, 而实际达到它们则是另一回事, 而后者往往更具挑战性. 同时, 数学家们常常思考利用他们众多抽象结构的新方法来表示消息或信息. 简而言之, 数学和工程界还有许多未完成的任务.

诚然, 并不是所有人都能将香农的伟大思想与其他数学家和工程师的成就相提并论. (也许有人会略感惊讶, 香农被称为信息理论之父. )尽管如此, 至少我们现在知道, 正是由于香农理论的帮助, 我们能够在一个日益迅速和不可避免的全球化浪潮的世界中, 进行如此高效和有效的沟通.

参考文献

[1] Claude Shannon (1948). A mathematical theory of communication. Bell Systems Technical Journal, vol. 27, pp. 379–423. Available for free at: http://www.alcatel-lucent.com/bstj/vol27-1948/articles/bstj27-3-379.pdf.

[2] Raymond Hill (1990). A first course in coding theory. Oxford Applied Mathematics and Computing Science Series: Oxford University Press, New York.

[3] James Gleick (2011). The information: A history, a theory, a flood. HarperCollins.

    注释
  1. [1]在概率论和信息论中, 两个随机变量的互信息(MI)度量了两个变量之间相互依赖的程度. 具体来说, 对于两个随机变量, 互信息是一个随机变量由于已知另一个随机变量而减少的“信息量”.

  2. 作者 | ALAN J.AW

    译者 | 万物有数

    原文发布于 Plus Magazine


来源:数来数趣

编辑:紫竹小筑


转载内容仅代表作者观点

不代表中科院物理所立场

如需转载请联系原公众号



相关推荐

如何屏蔽色情网站?_怎么能屏蔽网站

一、基础防御:全网DNS劫持阻断1.修改全网DNS服务器推荐DNS:安全DNS:CleanBrowsing(成人内容过滤):185.228.168.168/185.228.169.168Open...

容器、Pod、虚拟机与宿主机网络通信全解:看这一篇就够了

在日常开发与部署过程中,很多人一开始都会有这样的疑惑:容器之间是怎么通信的?容器怎么访问宿主机?宿主机又如何访问容器?Kubernetes中Pod的网络和Docker容器一样吗?容器跨机器是...

Win11专业版找不到共享打印机的问题

有很多深度官网的用户,都是在办公室上班的。而上班就需要使用打印机,但更新win11系统后,却出现同一个办公室里面的打印机都找不到的问题,这该如何处理呢?其实,可能是由于我们并没有打开共享打印机而造成的...

常用电脑快捷键大全,摆脱鼠标依赖,建议收藏

Ctrl+C复制Ctrl+X剪切Ctrl+V粘贴Ctrl+Z撤销Ctrl+Y重做Ctrl+B加粗Ctrl+A全选所有文件Ctrl+S保存Ctrl+N新建Ctrl+O打开Ctrl+E...

Win11实现自动追剧Jellyfin硬解,免NAS复杂操作

大家好,欢迎来到思赞数码。本期将详细介绍如何通过安装和配置Sonarr、Radarr、Prowlarr、qBittorrent和Jellyfin,打造一套自动化的影视管理系统。很多人认为,要实现自动追...

微软Win11安卓子系统WSA 2308.40000.3.0更新推送下载

IT之家9月21日消息,微软官方博客今日宣布,已面向所有WindowsInsider用户推送了Windows11安卓子系统的2308.40000.3.0版本更新。本次更新和之前...

路由器总掉线 一个命令就能猜出八九分

明明网络强度满格或有线图标正常,但视频卡成PPT、网页刷不开、游戏动不了,闲心这些问题很多小伙伴都碰到过。每次都要开关路由、宽带/光猫、插拔网线……一通忙。有没有啥办法能快速确定故障到底在哪儿,方便处...

windows电脑如何修改hosts文件?_windows怎么修改hosts

先来简单说下电脑host的作用hosts文件的作用:hosts文件是一个用于储存计算机网络中各节点信息的计算机文件;作用是将一些常用的网址域名与其对应的IP地址建立一个关联“数据库”,当用户在浏览器中...

win10广告弹窗ShellExperienceHost.exe

win10右下角老是弹出广告弹窗,排查为以下程序引起,但是这个是系统菜单的程序不能动:C:\Windows\SystemApps\ShellExperienceHost_cw5n1h2txyewy\S...

Win10 Mobile预览版10512/10166越狱解锁部署已被黑客攻破

看起来统一的WindowsPhone和Windows越加吸引人们的关注,特别是黑客们的好奇心。XDA论坛宣称,在Win10Mobile预览版10512/10166上,已取得越狱/解锁部署突破,比如可...

6款冷门小众软件,都是宝藏,建议收藏

真的很不错(。-ω-)zzzBearhttps://bear.app/cn/Bear是一个漂亮,灵活的Markdown的写作工具。它一样只支持苹果家的全平台。它一出现就惊艳四方,就被AppSto...

如何让不符合条件的设备升级Windows 11

如果你是最近(6月24日之后)加入WindowsInsider项目并且你的设备并不符合升级条件,那么当你在尝试升级Windows11的时候可能会看到以下错误:你的PC不符合Wi...

windows host文件怎么恢复?局域网访问全靠这些!

windowshost文件怎么恢复?windowshost文件是常用网址域名及其相应IP地址建立一个关联文件,通过这个host文件配置域名和IP的映射关系,以提高域名解析的速度,方便局域网用户使用...

Mac Hosts管理工具---SwitchHosts

switchhosts!formac是一款帮助用户快速切换hosts文件的工具,switchhosts!formac能够帮助你快速方便的打造个人专用的网络环境,支持本地和在线两种方式,并且支持...

「浅谈趣说网络知识」 第十二弹 老而不死的Hosts,它还很有用

【浅谈趣说网络知识】第十二弹老而不死的Hosts,它还很有用什么时候才觉得自己真的老了,不是35岁以上的数字,不是头上的点点白发,而是不知觉中的怀旧。风口上的IT界讲的就是"长江后浪推前浪...

取消回复欢迎 发表评论: