企业宣传,产品推广,广告招商,广告投放联系seowdb

特斯拉智能驾驶 从视觉优先的技术门路到未来的应战

特斯拉 作为世界 智能 驾驶畛域的技术先锋,其F(Full Self-Driving)方案选用了共同的纯视觉 智能驾驶 路途,摒弃了激光雷达和 高精度 地图的经常使用。特斯拉经过其自研的摄像头感知方案及数据驱动的 神经网络 ,在智能驾驶畛域取得了渺小停顿。但是,纯视觉方案在极其天气及某些复杂场景下体现的局限性,依然是亟需处置的疑问。

特斯拉智能驾驶的技术理念

1.1 纯视觉智能驾驶的外围思念

特斯拉在智能驾驶畛域的技术路途具有高度共同性。不同于大少数车企驳回的多 传感器 融合方案,特斯拉选用了纯视觉感知的技术门路,这象征着特斯拉的车辆齐全依赖摄像头启动环境感知,而摒弃了经常出现的激光雷达和高精度地图。这一选择源于特斯拉开创人埃隆·马斯克的常年决计:以为摄像头的视觉感知和数据处置才干足以替代激光雷达和其余传感器,进而成功车辆智能驾驶。这一设计思绪的基础在于对人类视觉系统的模拟。人类驾驶员依托眼睛和大脑对环境的感知与决策,特斯拉的纯视觉方案试图经过摄像头和神经网络 模拟 这一环节。详细来说,特斯拉的车辆装备了8个摄像头,这些摄像头担任全方位监测车辆周围的环境,并经过神经网络生成三维环境模型。这些摄像头区分笼罩车辆的前方、前方及左右两侧,并经过协作实时搜集环境数据,为智能驾驶决策提供允许。与激光雷达依赖反射激光来构建三维环境不同,特斯拉的摄像头经过图像处置技术生成3D场景,这种方法极大简化了传感器融合的复杂性,同时降落了 配件 老本。

1.2 数据驱动的神经网络

FSD系统的另一个外围竞争力在于其弱小的数据驱动才干。特斯拉在世界范围内领有庞大的用户基础,这为其积攒了少量的驾驶数据。自2020年FSD Beta版本在北美推出以来,特斯拉经过少量实在驾驶场景中的数据始终优化其神经网络模型。相比传统的规定驱动型智能驾驶系统,特斯拉驳回了端到端的神经网络架构,经过少量数据训练模型来替代复杂的规定编写,极大地优化了智能驾驶系统在复杂场景下的顺应才干。特斯拉在感知层提出了“BEV+Transfmer+Occupancy Network”的 算法 框架。经过这种框架,车辆可以以相似人类大脑的形式处置复杂环境中的 信息 。例如,FSD系统经过摄像头搜集图像数据,识别车辆、行人、路途标记等元素,并经常使用 深度学习 算法构建出周围的三维场景。随后,系统在神经网络中启动处置,生成驾驶决策并口头。这种数据驱动的模型在面对始终变动的环境时能够愈加灵敏,且随着数据量的参与,系统的性能和牢靠性也会逐渐优化。

1.3 智能驾驶算法的演进

特斯拉FSD算法的演进是一个从规定驱意向数据驱动转变的环节。早期的智能驾驶系统依赖于少量的规定编写和手工标注来成功感知和决策,但这种方法的局限性在于不可有效应答复杂多变的路途场景。特斯拉从2016年开局自研算法,经过始终迭代,逐渐引入愈加先进的神经网络架构。2019年,特斯拉在其算法中引入了“BEV+Transformer”架构,经过将车辆周围的2D图像数据转化为俯瞰图视角(BEV),并联合Transformer技术优化图像升维处置的才干。这一架构使得特斯拉FSD能够更好地处置复杂环境中的物体识别和行为预测,尤其在处置车辆交互、灵活阻碍物等场景时,体现杰出。2024年,特斯拉推出了FSD V12版本,这一版本标记着世界首个端到端神经网络量产上车。这象征着从数据输入到决策输入的整个环节都由神经网络成功,彻底解脱了传统的模块化算法架构。特斯拉经过这一改造,成功了从繁琐的规定编写到高效的数据驱动的转变,使得系统在处置复杂场景时愈加灵敏和准确。

特斯拉智能驾驶配件的迭代开展

2.1 配件架构的演进:从HW1.0到HW4.0

特斯拉的智能驾驶配件平台教训了屡次迭代更新,从2014年的HW1.0,特斯拉在每一代配件的更新中,都清楚优化了计算才干、摄像头的数量和系统的感知才干。这种配件迭代与特斯拉的软件开展同步启动,推进了FSD系统的始终成熟。

• HW1.0阶段(2014年):特斯拉最后的智能驾驶配件平台基于Mobileye的EyeQ3 芯片 ,关键配置是提供基础的智能驾驶辅佐配置,包含智能巡航和车道坚持。HW1.0仅装备了1个前置摄像头和 毫米波雷达 ,感知才干十分有限,关键依托传统的规定驱动型算法处置环境数据。这一版本并不具有齐全智能驾驶的才干,更多是辅佐驾驶。

• HW2.0阶段(2016年):HW2.0的颁布标记着特斯拉智能驾驶配件迈入了一个全新的阶段。特斯拉在这一阶段引入了NVIDIA DRIVE PX2计算平台,允许更弱小的数据处置和计算才干。车辆装备了8个摄像头,包含前置、后置及侧向摄像头,笼罩车辆周围的一切方向。毫米波雷达依然保管,用于提供额外的深度感知允许。这一版本的配件更新,使得特斯拉的车辆能够处置愈加复杂的智能驾驶义务,如智能变道和智能泊车。

• HW3.0阶段(2019年):特斯拉在HW3.0阶段推出了自研FSD芯片,彻底解脱了对NVIDIA芯片的依赖。FSD芯片具有每秒2300帧的图像处置才干,大幅优化了系统的计算才干。HW3.0装备了8个摄像头和12个超声波雷达,确保车辆可以全方位监测周围环境,同时提高了感知的准确度。得益于自研芯片,特斯拉能够愈加灵敏地在配件上部署其神经网络算法,使得FSD系统能够在配件上成功高度优化。

• HW4.0阶段(2023年):HW4.0是特斯拉 最新 的智能驾驶配件版本,这一版本间断了纯视觉方案的外围思念,同时进一步增强了摄像头的感知才干。HW4.0装备了12个摄像头,像素从120万优化至500万,摄像头的探测距离到达424米。此外,特斯拉从新引入了高精度4D毫米波雷达,以补偿纯视觉方案在极其天气或复杂光照条件下的局限性。HW4.0的 处置器 也失掉了大幅更新,内核从12个参与至20个,使得系统具有更强的计算才干,能够应答愈加复杂的驾驶场景。

特斯拉FSD配件端迭代历程,源自:华金证券

2.2 配件优化的战略:以摄像头为外围,缩小冗余传感器

在配件架构的演进环节中,特斯拉采取了一种共同的“减法”战略,即逐渐缩小对其余冗余传感器的依赖,最终齐全依赖摄像头来成功智能驾驶的环境感知义务。特斯拉在HW3.0阶段曾分批移除不同车型装配的毫米波雷达,以为摄像头加上数据驱动的算法足以应答大少数驾驶场景。但是,随着技术开展和用户反应,特斯拉在HW4.0阶段从新引入了4D毫米波雷达,尤其是在顽劣天气下优化系统的感知才干。相比于激光雷达等高老本的传感器,摄像头的老本更低,且更容易与现有的神经网络算法联合。激光雷达的高精度诚然能够提供更丰盛的环境感知数据,但其多少钱低廉,动辄数千美元的配件老本使得激光雷达不适宜大规模量产车型。而摄像头的老本则大大低于激光雷达。例如,HW4.0中12颗摄像头的配件老本约为3600元人民币,4D毫米波雷达的老本在500-600元之间,相比于激光雷达的高老本,特斯拉的纯视觉方案在大幅降落老本的同时,依然能够提供足够的环境感知才干。特斯拉这种“减法”战略的成功与其弱小的算法亲密相关。经过对摄像头采集的数据启动深度处置,特斯拉的神经网络能够成功对环境的精准了解,并作出相应的驾驶决策。这种纯视觉方案不只降落了配件老本,还简化了系统的复杂性,使得FSD具有更高的市场竞争力。

2.3 配件的自研长处

自从HW3.0开局,特斯拉开局研发自有的FSD芯片。这一动作为特斯拉带来了清楚的竞争长处。相比于依赖外部供应商的芯片,特斯拉自研的FSD芯片能够更好地与其算法启动适配,并在处置性能上启动专门的优化。这使得特斯拉的配件架构不只在计算才干上愈加杰出,还在老本控制上领有更强的长处。自研芯片的一个关键长处在于它为特斯拉的配件开发带来了更高的灵敏性。特斯拉可以依据其智能驾驶系统的详细需求,灵敏调整芯片的设计和配置。这种灵敏性不只使得配件能够愈加高效地运转特斯拉的神经网络算法,还大大提高了系统的性价比。此外,随着特斯拉在智能驾驶畛域积攒越来越多的数据,自研配件的价值将进一步凸显,由于特斯拉可以在芯片层面上对算法和配件启动同步优化,进而优化FSD的全体性能。

特斯拉智能驾驶系统的实践体现

3.1 FSD驾驶决策的拟人化体现

特斯拉FSD的一个清楚特点是其高度拟人化的驾驶决策。这一特性在最新的FSD V12版本中失掉了进一步优化。FSD系统经过少量的路途行驶数据学习人类驾驶员的行为,并在复杂驾驶场景下模拟人类驾驶员的决策形式。与之前的版本相比,FSD V12在速度控制、转向平滑度以及对突发状况的应答方面,都愈加凑近人类驾驶员。例如,FSD V12在红绿灯启停、转向和变道环节中,能够做到愈加颠簸的驾驶,极大地缩小了乘客在这些操作中的顿挫感。同时,系统在遇到前方缓慢行驶的车辆时,能够迅速判别能否变道超车,并采取正当的速度启动变道。特斯拉经过深度学习和端到端的神经网络训练,使得FSD在复杂路途场景中的决策才干失掉了清楚优化。此外,FSD系统在处置与其余交通介入者的互动时也体现杰出。比如,系统在面对行人横穿马路时,能够迅速减速并留出足够的安保距离,随后内行人经事先继续减速行进。这种相似人类驾驶员的反响,使得FSD的驾驶体现愈加拟人化,优化了乘客的乘坐体验。

3.2 安保性与牢靠性

特斯拉FSD在安保性方面的体现尤为突出。依据特斯拉颁布的安保数据,FSD在开启后的行车安保性清楚高于传统驾驶形式。特斯拉的数据显示,在开启FSD配置的状况下,每行驶539万英里才或许出现一批准外,而全美平均水平是每行驶67万英里出现一批准外。这标明FSD系统能够清楚缩小驾驶环节中的潜在危险,提高行车安保性。此外,FSD系统的牢靠性也在始终优化。特斯拉的 最新版 本FSD V12在市区环境中的无接收行驶里程曾经到达622公里,较之前的版本大幅优化。这象征着,在大少数日常驾驶场景中,车辆可以依托FSD系统自主成功驾驶义务,而无需驾驶员频繁干预。这一停顿显示出特斯拉智能驾驶技术在市区路途环境中的顺应性和牢靠性正在逐渐提高。

3.3 纯视觉方案的局限性

虽然特斯拉的纯视觉方案在少数场景下体现优秀,但在一些极其天气或光线条件较差的状况下,摄像头的体现仍存在必定的局限性。例如,在夜间驾驶或大雾天气下,摄像头的感知才干会遭到限度,造成系统不可准确判别环境中的物体。这种局限性是特斯拉从新引入毫米波雷达的要素之一,尤其是在HW4.0阶段,特斯拉经过高精度4D毫米波雷达补偿了摄像头在这些场景下的无余。

此外,特斯拉FSD在面对某些长尾场景(例如非常规或极其驾驶状况)时,系统仍或许出现误判。例如,在遇到不凡外形或装载过多东西的车辆时,FSD系统或许不可准确识别这些车辆的外形,进而造成失误的驾驶决策。这些长尾场景虽然在实践驾驶中并不经常出现,但假设不能有效应答,仍或许对驾驶安保性发生影响。

特斯拉FSD在中国市场的运行与应战

4.1 中国市场的机会与应战

中国作为世界最大的 新动力 汽车市场,关于特斯拉FSD而言,是一个至关关键的战略市场。特斯拉自进入中国以来,经过其高性能的电动车和先进的智能驾驶技术,赢得了少量生产者的青眼。数据显示,截止2023年底,特斯拉在中国市场的累计销量曾经超越170万辆,这为FSD的推行奠定了宽泛的用户基础。但是,特斯拉在中国市场推行FSD也面临一些共同的应战。首先,中国的监管环境相对复杂,特意是在高精度地图和数据安保方面,中国政府对智能驾驶技术的要求十分严厉。特斯拉须要与中国的外乡企业协作,确保其智能驾驶系统合乎中国的法规要求。为此,特斯拉曾经与百度协作,取得了车道级的导航地图,以允许其FSD在中国的落地。此外,特斯拉方案在中国建设本地的数据 中心 ,确保一切车辆数据能够在中国境内启动存储和处置,以合乎中国的数据安保政策。

4.2 市场浸透与潜在收益

虽然面临应战,特斯拉在中国市场的前景依然十分宽广。假定FSD在中国市场的浸透率到达5%,特斯拉将在中国市场新增54.4亿元的支出。特斯拉经过宽泛的用户基础和始终优化的智能驾驶技术,有望在中国市场成功可观的增长。为了减速FSD在中国市场的推行,特斯拉曾经推出了EAP(增强版智能驾驶)的订阅服务,用户可以按月或按季度支付费用经常使用局部初级智能驾驶配置。这一灵敏的订阅形式不只参与了现有用户对智能驾驶配置的接受度,还为未来FSD在中国市场的片面推行奠定了基础。

未来展望:特斯拉FSD的技术趋向与市场竞争

5.1 技术趋向:从视觉感知到全场景智能驾驶

未来,特斯拉将继续深化其纯视觉技术路途,同时经过配件和软件的继续优化,进一步优化FSD系统的性能。特斯拉在算法层面将继续推进端到端神经网络的运行,缩小对传统规定编写的依赖。随着数据量的参与,FSD系统将逐渐在更复杂的驾驶场景中成功拟人化决策,最终成功全场景智能驾驶。在配件方面,特斯拉或许会继续优化其摄像头和雷达的组合,经过优化摄像头的分辨率和感知范围,以及引入更多的高精度传感器,进一步优化系统在极其场景中的体现才干。同时,特斯拉的自研芯片将继续在配件层面上为FSD的算法提供弱小的计算才干允许,确保系统能够实时处置少量数据并作出准确决策。

5.2 市场竞争:世界与中国的双重应战

虽然特斯拉在世界范围内的智能驾驶技术处于上游位置,但其面临的市场竞争压力正在始终放大。国际外的汽车制作商和 科技 公司 都在踊跃规划智能驾驶技术。例如,国际的蔚来、小鹏和理想等新兴车企曾经在智能驾驶畛域取得了清楚停顿,并在某些场景下与特斯拉开展了强烈竞争。在中国市场,特斯拉须要面对外乡车企的微弱竞争,同时还须要顺应中国市场的共同法规要求。为了坚持竞争长处,特斯拉须要在技术上始终翻新,同时经过本地化的战略顺应中国市场的需求。此外,特斯拉还需减速智能驾驶技术的商业化进程,例如推出 机器人 出租车服务等新业务,以应答市场的多元化需求。

结语

特斯拉FSD方案经过其共同的纯视觉技术路途、数据驱动的端到端神经网络,以及自研配件的长处,奠定了其在世界智能驾驶畛域的上游位置。虽然其技术在许多方面体现杰出,但在面对复杂的市场需求和严苛的监管环境时,特斯拉仍需继续优化其系统性能,以确保在未来的市场竞争中继续坚持上游。同时,随着世界智能驾驶技术的极速开展,特斯拉能否在中国等关键市场顺利推行其FSD技术,将是选择其未来市场位置的关键要素。‍

参考文献:

华金证券:特斯拉智能驾驶方案简剖

「智驾最前沿」微信群众号后盾回复:,失掉:特斯拉智能驾驶方案简剖 pdf 下载 形式。


具身智能时代呼唤“端到端”

“随着模型能力的迭代,以及模型从语言模型逐渐变成一个加上生成、多模态理解的能力,相信在今年年底、明年可能会期待有质变的产生,从务实的角度来看,大模型目前阶段只是一个初步的阶段。”

文丨智驾网 王欣

一辆搭载着FSD V12.3.1 Beta的特斯拉穿梭在旧金山市闹区的傍晚,依靠纯视觉端到端的方案完成了从车位驶出到目的地停靠路边的丝滑操作。

马斯克几乎会以每两周的节奏对FSD进行一次“大改”,直到这次FSD V12.3.1 Beta的更新。

3月25日,马斯克向全体特斯拉员工发了一封邮件,要求必须为北美地区提车的客户演示并安装激活FSD V12.3.1 Beta,并在交车前让客户进行短暂的试驾。 希望让人们意识到FSD确实有效。

紧接着,马斯克又随即公布特斯拉基于纯视觉方案的端到端自动驾驶泊车功能将在这几日推送,在Twitter上对FSD不惜溢美之词的进行宣扬:开特斯拉用FSD,几乎哪儿都能去。

新版本发布后,海外媒体平台充斥着该版本的测试视频,不少网友对FSD V12.3.1在北美城市道路中的驾驶能力表达了赞叹:Tahts so cool!

作为引领自动驾驶风向标的特斯拉,已经将端到端自动驾驶的热流从北美流入了国内,又从舆论场的角逐带到了今年3月15日-17日召开的电动汽车百人会的产业演讲中来(以下简称:百人会)。

端到端的风暴,在中国正式打响了“第一枪“。

纯视觉在端到端中的“AB”面

随着高速NOA走向城市NOA,自动驾驶系统的复杂程度在大幅提升,数百万行的C++代码对人工编写规则方式带来巨大的成本。

这时,完全基于人工智能和神经网络的感知模块不会存在因为手动编写规则引发效率低下的困惑,所以现如今的行业风向走到基于大模型的端到端自动驾驶。

多家企业在今年百人会论坛中亮相了行业成果的殊荣,各家对于感知的技术路线看法也各有千秋。

去年,商汤的端到端自动驾驶大模型UniAD入选了2023年CVPR最佳优秀论文。

绝影是商汤智能汽车的板块,商汤绝影智能汽车事业群总裁王晓刚在百人会上表示:“端到端的自动驾驶UniAD,是今年我们自动驾驶最大的突破,从高速到城区的领航,在这里可以看到场景日益复杂,需要大量的工程师每天去解决层出不穷的各种case。 端到端自动驾驶是数据驱动,能够为我们高效地解决城区的领航,提供更加高效实践的路径。 ”

与传统的的单模态模型相比,多模态大模型的优点在于它可以从多个数据源中获得更丰富的信息,从而提高模型的性能和鲁棒性。

王晓刚还提到,商汤进一步提出了多模态大模型自动驾驶方案,这种方案的输入,除了各种感知传感器,系统的信息以外,还允许人机交互,通过自然语言作为输入。 当自动驾驶时觉得旁边大车有压迫感,如果想要离它远一点,或者想超车,都是可以通过语言模型进行交互。

另外,输出的时候不但可以输出感知,还可以输出规控,还可以对自动驾驶做出的决策有解释性。

毫末智行CEO顾维灏也发表了对多模态大模型的看法,基于毫末的的DriveGPT,顾维灏表示,DriveGPT最核心的能力是基于持续的多模态的视觉识别大模型。

“我们把它用Token化的表达方式进行训练,再进行三维化,这是我们做大模型很重要的技术基础。”

DriveGPT是毫末智行研发的垂直领域大模型,在视觉大模型基础上,毫末又构建了多模态大模型,用以实现感知万物识别的能力。

顾维灏表示:“多模态放到视觉大模型里面,就会让视觉三维的渲染、标注、识别,能够提前自动化地理解这个照片里面,或者是说前融合后的数据里面究竟这个桌子和讲台是怎么样来分割的,所以加入了多模态大模型。 在认知模型里面,我们又加入了大语言的模型。 大语言模型它不仅仅是自然的交互,它还有很多知识的理解。 ”

网络和火山更强调座舱大模型,共识是:认为座舱大模型天生是多模态的场景。

网络的语音和大模型的一体化方案已经在极越车上落地,网络智能云汽车行业解决方案总经理肖猛认为,2024年是座舱大模型的元年。

同时,极越还是目前国内唯一采用纯视觉自动驾驶方案落地的车企,基于网络Apollo纯视觉高阶智驾能力和安全体系赋能,极越完成OCC(Occupancy Network,占用网络)升级,已形成“B.O.T”(BEV+OCC+Transformer)完整技术体系。

与传统的视觉方案相比,OCC的一个显著优势在于它能够处理未知或不常见的物体,降低了因未识别物体而可能引发的意外情况的风险。 OCC还能够以厘米级的精度对障碍物进行三维建模。

3月26日,极越在其AI DAY2024技术大会上,发布了OTA V1.4.0新版软件,升级涉及智能驾驶、智能座舱、智能互联、三电等诸多领域,共计升级200多项功能。

当OCC对应在PPA(点到点领航辅助)功能上,就能使车辆拥有更合理的路线规划,并实现更流畅的变道和绕行。

火山引擎汽车行业总经理杨立伟在谈到大模型在各个行业应用时,发现汽车行业一个非常大的特点。

他表示:“手机目前交互形态还是基于触摸屏幕,通过屏幕来交互的产品形态,所以这也是为什么我们看Siri和手机里面的语音助手做的不好,我相信座舱内有非常便利的空间,目前没有大模型的时候,我们座舱的语音交互的时长和频率已经非常高,座舱是天生多模态的场景,机器想要跟人有互动更好,大模型更像一个人机交互的操作系统和人机交互的智能品。 这样的话没有多模态的能力是不行的。 ”

端到端是自动驾驶研究和开发领域的一个活跃研究方向,这是不争的事实,但端到端自动驾驶技术尚未成熟,跟随特斯拉FSD V12的后来者虽多,但对于任何一家具备研发自动驾驶技术能力的企业来说,光是从普通架构切换到端到端技术的单项成本就颇高。

杨立伟坦诚地表达了这一观点:大模型现在在整个汽车行业的应用还是偏早期阶段。 “刚才我们还在讨论,目前是量的提升,没有到质变,随着模型能力的迭代,以及模型从语言模型逐渐变成一个加上生成、加上多模态理解的能力,我相信在今年年底、明年可能会期待有质变的产生,从务实的角度来看,大模型目前阶段只是一个初步的阶段。 ”

感知固然重要,它提供了必要的信息输入,是司机的“眼睛与耳朵”,与它同样重要的,还有被业界及科研机构不断研究的认知,涉及到规划、决策和应对复杂或紧急情况的能力,相当于司机的“大脑”。

而只有当大模型作为自动驾驶的驾驶员,在认知层面远超于人类时,才能做出超出人类的决策能力,这时,感知、认知会不断迭代,甚至超出人类认知的上限,自动驾驶才会迎来真正所谓的GPT、IPhone时刻。

北京大学计算机学院教授黄铁军在百人会上对当下自动驾驶发展阶段进行了总结:

第一个阶段:只关心感知精度,缺乏认知的阶段,现在大部分车还处于这一阶段,就是L2、L3还很难,因为你只关心感知,不关心认知,这是肯定有问题的。

第二个阶段:特斯拉的FSD,但是他也不是真正的大模型,他只是用了Transformer,还是学人类的驾驶行为。 但未来一定是对世界的深度认知,加上很强感知的时代。

不过目前,基于纯视觉方案的端到端自动驾驶,仍被很多主机厂认为是跨越鸿沟的必经之路。

因为不需要大量的人工策略、只需要采集足够多的优质驾驶数据来训练即可,可以通过规模化的方式不断扩展数据来不断提升系统的能力上限。

但这种简单也隐藏了巨大风险。

完全基于视觉的端到端自动驾驶不具备传统自动驾驶系统的“透明性”,传统自动驾驶即模块化方法,端到端自动驾驶是一体化方法,不产生中间结果,直接通过图像输入,直接输出控制信号,但这种技术路线也存在彻底黑盒,解释性差的问题。

同时,端到端模型的训练需要处理大量的数据,包括多模态视觉数据和车辆控制信号等。

当大模型训练的“暴力美学”应用在自动驾驶上

端到端可以类比做GPT-4语言模型,通过收集海量的数据加上训练而实现的。

以特斯拉为例,通过遍布全球的几百万辆量产车,可以采集到足够丰富、足够多样的数据,再从中选出高质量数据,在云端使用数万张GPU、以及自研的DOJO进行训练和验证,使得端到端自动驾驶能够从paper变成product。

OpenAI的秘诀一直以来是屡试不爽的Scaling Law——当数据和算力足够多,足够大,就会产生智能涌现的能力。

直到Scaling Law在这次百人会中被诸多次提及,意味着自动驾驶的成熟需要“暴力美学”来催化,而背后是高昂的算力支出来支撑。

黄铁军在百人会上明确强调了大模型未来超越人类的关键不是靠概率,靠的正是对海量语料,数据背后精确的理解。

顾维灏表示,伴随着人工智能和大模型的发展,自动驾驶迎来了第三个阶段:数据驱动的时代。

或许可以这么理解:大部分代码都不是工程师来写,这些工程师从第二个阶段的“软件驱动的时代”来到了第三个阶段的“数据驱动时代”,解放了过去写软件的双手,所有的工程师都是在准备数据、准备环境、训练模型、检验最后的结果、调整结构、调整参数等工作。

最近一段时间的发展,顾维灏认为或许是自动驾驶的3.0时代。 “每一个时代里面的感知、认知和模型是什么样方式来实现的,都完全不一样。 ”他说。

智能驾驶1.0 时代,是以硬件驱动为主;2.0 时代,是以软件驱动为主;3.0 时代,则是数据驱动为主的大模型时代。

“端到端一定是未来很重要的方向,但它不会这么快到来,”顾维灏表示。 他认为还需要几年的发展。 “把过去的离散的部分逐渐地聚集化、模型化,把感知的模型聚集到一块,把认知的模型聚集到一块,控制的模型聚集到一块,然后再来实践车端模型和云端模型的联动。 ”

在 3.0 时代中,顾维灏指出端到端是最重要的方向,目前行业的发展趋势是一个从分散到聚集的过程。

在谈到算力需求时,王晓刚认为,过去发展的过程当中,从2012年AlexNet出现,深度学习神经网络大规模的应用,对于算力的需求是上千倍的提升。 随着ChatGPT、GPT-4,甚至更大规模的大模型,我们有上亿倍算力需求的提升。

如何分配技术和下一代技术算力的精力、资源也是一针见血的问题。

网络智能驾驶事业群组首席研发架构师王亮在百人会活动上接受媒体采访时透露:“我们选择纯视觉路线,放弃了激光雷达把它拿掉也是资源的原因。我们希望把所有算力、数据、处理资源、人才、模型参数规模都给到纯视觉</stron

国产特斯拉有没有自动驾驶

【太平洋汽车网】国产特斯拉有自动驾驶。 在国外,特斯拉可能是走在最前面的,在此前国外网友体验特斯拉FSDBetaV8.2的视频中可以看到,纯视觉模式的自动驾驶看起来似乎已经比较完整了。

比如在通过路口时,它会自动识别红绿灯,进行自动减速、跟车、绿灯通过路口等一系列操作。 转弯汇入主路时,在没有红绿灯的情况下,它可以提前识别过往的车辆,等待安全时,再进行转弯。

纯视觉的好处是它不依赖高精地图,即使是在商场停车场这种内部道路,它也可以自动识别过往的车辆,进行避让。

国内的自动驾驶技术,发展同样很快。 在上海车展前,有媒体放出了搭载华为智能驾驶系统的极狐阿尔法SHI(HuaweiInside)版的体验视频,从视频里看到,华为的自动驾驶技术,已经可以比较自如的应对城市复杂道路了,过红绿灯、变道、避让等等复杂的操作都能实现。 从整体的效果来看,华为的自动驾驶技术,并不比特斯拉的差。

42号车库视频截图不过极狐阿尔法SHI(HuaweiInside)版上搭载的自动驾驶技术,是有激光雷达的,并不是纯视觉。 当然,雷达和纯视觉只是两种不同的技术手段,都可以实现自动驾驶,并没有好坏之分。

除了华为之外,其他国内自动驾驶技术现在到底如何?前两天,汽车之家体验了智己L7上搭载的自动驾驶技术,从体验视频来看,智己的智能驾驶系统IMAD同样已经比较完整了。

一、高架+城市道路,基础操作像是老司机根据智己官方信息来看,智己L7的智能驾驶系统IMAD(IMAutonomousDriving),配备了12个最高可达500万像素的摄像头,5个五代毫米波雷达,12个定制化的超声波雷达,以及高精度惯导、高精度地图和V2X等车端解决方案,组成了360°无盲区覆盖的感知系统。

从硬件配置来看,这是一个以视觉为主,雷达为辅的智能驾驶系统,这也是目前比较成熟和被认可的自动驾驶解决方案。 相比于特斯拉等主推的纯视觉方案,就现阶段来说,视觉+雷达的组合在极端环境的安全性、可靠性方面表现更加稳定。

在实际的体验中可以看到,搭载智能驾驶系统IMAD的智己L7,在城市道路和高速道路都能较好的完成自动驾驶的一系列操作。

在城市道路的红绿灯路口,车辆会识别红绿灯,然后根据情况转弯通过路口。

(图/文/摄:太平洋汽车网问答叫兽)

马斯克又要玩把大的,特斯拉要做车机界的下一个安卓?

很多人都很认同这么一种说法:如果不是特斯拉公开专利,就没有今天的蔚小理。

这种说法有一定的道理,特斯拉的技术确实在一定程度上帮到了蔚小理们,但是也太过于片面,蔚小理等新势力在如今的核心技术方面,确实很有自己的一套。

而马斯克最近提出特斯拉可能会向其他汽车制造商,开放其一些汽车操作系统代码。 马斯克还说:就像Android对手机行业有所帮助,作为一种通用标准,我们有可能开源更多的代码。

这番言论一下又让很多人坐不住了,你特斯拉公开了一些FSD的技术专利,电池电控的专利,这次又要把操作系统开放,特斯拉几乎已经快没有秘密了,而马斯克这次又在憋什么大招呢?

想要做车机届的“安卓”,特斯拉有这个能力?

如果特斯拉真的要迈出这一步,那么它的汽车操作系统软件开源并商业化,可能也就意味着特斯拉要在操作系统方面与谷歌和苹果展开竞争,这对于改变行业格局,推动行业发展无疑是一个有利的趋势,虽然车机行业内目前没有什么所谓的垄断,但是垄断在暗处其实已经形成了。

特斯拉开放车机系统源代码,可以加快智能汽车的发展,降低整体成本,因为马斯克的这番言论,正是福特首席执行官Jim Farley在谈到做客OTA的汽车非常难时所提出的,这样可以并使各个厂商之间技术差距逐渐缩小,从而促进行业共同进步。

同时,除了车企之外,许多公司都在向着智能化、数据化的方向发展,如何打造出更具竞争力的产品成为重中之重。 随着特斯拉开放车机系统的源代码,“三大巨头”之间必将展开一场新的竞争。 据悉,苹果早在几年前就开始布局自己的车载操作系统,并积极收购相关企业,而且全新的深度根植于车辆的CarPlay系统很有可能在今年正式亮相。 而谷歌也一直在开发 Android Automotive 系统,希望抢占智能汽车领域的制高点。

目前,特斯拉已经将自家电池技术、Autopilot 智能驾驶技术进行了开源,这一次再次开放车机系统,无疑会让这两个还未完全施展开拳脚的巨头,重新审视自己的产品。

魔改安卓系统已过时,下一步就要魔改特斯拉车机?

那么,特斯拉开放车机系统的源代码,对于特斯拉和整个行业又意味着什么呢?表面上觉得特斯拉这是在养虎成患,实则这一招可能更狠?

首先,对于特斯拉而言,开放源代码是一种积极态度,也是一种企业的担当,不管你愿不愿意接受,这种开放的态度,绝大多数企业都不具备。 在新技术的创新过程中,特斯拉往往是领头羊,通过开放源代码,特斯拉能够更好地与全球社区分享其智能化技术成果,同时也可以吸引更多的人才加入特斯拉这个庞大的创新生态中来,促进企业的可持续发展,在如今这个时代,小到一个群体,大到一个城市或者国家的各行各业都在抓紧抢人,特斯拉摆出这样的姿态,把自己最封闭的Linux系统拿出来,注定会吸引到更多人才。

对于整个行业而言,特斯拉开放车机系统的源代码,也有着重要的意义。 首先,特斯拉将推动智能汽车行业的进一步发展,促进行业上下游的合作和融合,把更多相关企业捆绑到特斯拉的战车上来。 其次,开放源代码有助于打破行业壁垒,加强开放合作,传统车企们很多都选择使用Linux系统来开发车机(BBA都用的Linux底层),正是因为这是一个闭环系统,安全性高,但是过于闭环的系统限制了创新,特别是与其他智能化终端的联系。

如今蔚小理们都用安卓系统作为底层,而后搭建车机,正是因为安卓系统的开源包容性,而特斯拉等使用Linux系统的车机,在智能化的丰富度上不及安卓系统,而在开源后,特斯拉的车机肯定也会让使用者可以通过自主开发软件将车辆与自己的更多智能设备进行联动,实现更便捷、智能的生活体验。 其次,开放源代码还可以带来更多的选择,例如消费者可以自由更换和定制车载系统、车载应用等,不再被厂商所束缚。 这可以提高车辆的灵活性和定制性,满足用户不同的需求和偏好,其实也是特斯拉从自身角度对行业发起的一次进攻。

当然开放源代码有着许多优点的同时,也存在一些挑战,就比如开放源代码可能会增加产品的安全风险,源代码的发布也意味着黑客攻击的可能性增大。 其次,对于专利和商业机密等知识产权问题,开放源代码也可能会引发纷争。 特别是在行业内竞争激烈的当下,几乎所有企业都希望尽可能保护自己的核心技术,但是为了打造一套新的行业标准的特斯拉车机,可能并不在乎这些,只是今后我们看到一些“技术人士”攻破特斯拉系统的新闻后,并不用太过惊讶。

所以,特斯拉公开操作系统源代码,不但能把自己一直以来“无私”的形象立住,同时还能吸纳到更多的人才,而且像谷歌和苹果这两位潜在的对手,今后肯定会压力倍增,虽然它们在以往有着强大的号召力,但是在操作系统这方面,特斯拉真的有能力与它们进行抗争,当然特斯拉想在车机端搞一些动作,可能也有FSD已经快到顶了的原因。

如果特斯拉开源操作系统源代码的进程会很快的话,那么今后新势力们的车机可能就不再是魔改的安卓系统了,有可能会把拿着特斯拉的操作系统好好魔改一番。 这里可能很多人不爱听了,但从汽车智能化发展了这么多年来看,特斯拉做出一些不可理解的操作后,比如不用高精地图、激光雷达,做纯视觉自动驾驶这一点,新势力们肯定是会反特斯拉而行之,但是最终还会向着特斯拉的技术上靠拢,要不我们也不会看到新势力们在2023年集体转向BEV架构,以及使用占用网络等空间网络技术来提升视觉感知能力。

这么多年来,特斯拉一直在公开自己的专利技术,方便了很多后来者,但是特斯拉如此的“散尽家财”,虽然使用特斯拉的专利是有隐含条件的,不支付相关费用使用特斯拉专利后,就将永久地失去了对特斯拉进行诉讼的权利。

但特斯拉没有让自己衰落,反而越来越强,销量越来越大,这就要引人深思了,绝不只是因为车卖得便宜有性价比这么一点原因。

总结:

这一次特斯拉开放车机系统的源代码是一个既有优点又面临挑战的行为。 行业需要特斯拉这样的企业,虽然面临的问题也很明显,但总体而言,它对于整个汽车制造业来说是一件好事。 未来在这场竞争中,谁能抢占主动权,谁能在技术和市场上走在前列,谁就能够赢得更广阔的发展空间,但自主品牌在这几年间的快速进步,也把压力给到了特斯拉,如果特斯拉不在其他方面上发力,那么它在未来也将很快失去优势。

© 版权声明
评论 抢沙发
加载中~
每日一言
不怕万人阻挡,只怕自己投降
Not afraid of people blocking, I'm afraid their surrender