数据合规人要懂的50个产品技术名词.docx
数据合规人要懂的50个产品技术名词1 .什么是数据发现?一旦数据收集完成,下一步就是数据发现。数据发现是识别可用于数据分析和/或数据整合的数据集的过程。这一阶段对于评估数据质量至关重要,因为数据发现工具可以浏览数据或应用高级分析来监测模式和异常值。帮助商务用户进行日常操作和业务决策这一目的,可以通过可视化分析来实现。数据准备这一关键阶段往往被忽视,然而在正确处理数据之前了解数据意味着数据在共享使用时会更加可靠。数据发现过程使用工具及专业知识,在数据专家的协助下、从收集到的数据中观测到模式或趋势。数据发现可以分为两大类:手工数据发现是传统的商业智能过程,由数据专家凭借他们渊博的应用案例知识、理解力和丰富经验,手工绘制数据图。这种方法完全依赖个人理解力,由数据专家构思并勾勒出数据图表,用以关联和理解数据。智能数据发现是一种更现代的商业智能形式,使用机器学习的自动化过程来揭示数据价值、并提供高质量的商务见解。使用人工智能的优点是,耗时少,可以准备、构思、整合和共享相关联的数据。也可以编制数据可视化,呈现隐藏的模式和有价值的见解。2 .什么是分类分级?分类:更多是从业务角度出发,在企业理清数据家底后,明确知道哪些数据(其实应该是元数据,更贴切一些应该是字段)属于哪个业务范畴,也就是类别。这个业务范畴囊括的范围可大可小,完全依托于企业前期基于业务的梳理结果。举个例子:身份证号这一类数据,既可以属于个人信息范畴,也可以属于个人基本信息范畴,前者的范围明显大于后者。也许有朋友会发出疑问,给业务划分类别当然是越细越好。这就是笔者要在此处强调的,做数据分类,并不是业务越细分越好,因为很有可能细分业务之后,最终却发现无数据可进行归类,这是典型分类失败的体现。当然反过来也成立,分类少了,数据归不进去,也是分类失败的体现。分级:不同于数据分类,对于大多数企业来说,更多是从满足监管要求的角度出发。数据分级属于数据安全领域,或许称呼它为敏感等级更为贴切。企业中的数据有的密级程度高、有的低、有的可公开、有的不可公开,敏感等级不同的数据对内使用时受到的保护策略不同,对外共享开放的程度也不同。如果企业对自己内部的数据没有一个明确地认识,先不说是否可以满足监管要求,对于自身的运营来说都是严重的隐患,因为很可能一不小心就将内部的敏感信息泄露了出去。3 .什么是元数据?元数据(Metadata)中的元(Meta)J可以理解为事物或对象,数据(data)J当然就是指该对象的相关数据。你可能接触过照片的元数据,其中包括图像尺寸、拍摄时间或者是光圈和快口信息、GPS数据,对于视频文件也一样,比如画面的尺寸、视频和音频的编码、时长等等。实际上你可以理解成,关于该文件或对象的一切信息都是元数据,无论是技术相关的信息还是内容信息的一切。技术型元数据技术型元数据通常涵盖了从相机或摄像机获得的信息范围,这很自然,因为这些数据主要就是由其拍摄和生成的。其中除了包括前面提到的图像大小、帧速率、编码以外,还可能(取决于相槌口来源)包括镜头型号、焦距、白平衡、相机硬件序号、镜头硬件序号等等。取决于摄像机型号的不同,一些基本数据会跟随数字媒体文件的生成被嵌入到媒体文件内部,而另一些可能会被单独存储在一个称为FSidecarJ的文件中,这通常是一个XML文件,而且带有硬件生产商的特定属性。内容型元数据这通常是更有用的元数据,因为它包括的范围更广。内容型元数据除了能用来描述媒体或片段的内容以外,还可以被用来对素材进行管理、分类、纳入上下游操作流程,甚至也能提供一些技术型元数据的功能。基本上,你可以把内容型元数据直接理解成关键字,但它有除了可以是字符型内容以外,还可以是评分、勾选框等类型。内定型元数据可以非常简洁,也可以非常冗长,但相同点在于,它们目前来说都是由工作人员在制作流程中手动添加和修改的。也许是摄像师在拍摄中添加的场号、镜号,也许是DlT人员添加的卷号、样片号、机位编号、景别附注、外观附注,也许是剪辑助理或VFX艺术家添加的各种注释等等。4 .什么是数据映射(DataMapping)?给定两个数据模型,在模型之间建立起数据元素的对应关系,将这一过程称为数据映射。数据映射是很多数据集成任务的第一步,例如:数据迁移(datamigration)、数据清洗(datacleaning)、数据集成、语义网构造、p2p信息系统。5 .什么是数据迁移(DataMigration)?数据迁移是指将数据从一个位置转移到另一个位置,从一种格式转换为另一种格式,或从一个应用程序移动到另一个应用程序的过程。数据迁移通常是为数据引入新系统或位置的结果。业务驱动因素通常是应用程序迁移或整合,在这种迁移或整合中,原有系统会被共享同一数据集的新应用程序所取代或增强。如今,随着企业从内部基础架构和应用程序迁移到基于云的存储和应用程序以优化或转变公司,数据迁移即开始。6 .什么是数据清洗(DataCleaning)?对数据进行重新审查和校验的过程,目的在于删除重复信息、纠正存在的错误,并提供数据一致性。数据清洗从名字上也看的出就是把脏的洗掉,指发现并纠正数据文件中可识别的错误的最后一道程序,包括检查数据一致性,处理无效值和缺失值等。7 .什么是数据治理(DataGovernance)?数据治理是指为确保数据安全、私有、准确、可用和易用所执行的所有操作。它包括人们必须采取的行动、必须遵循的流程以及在整个数据生命周期中为其提供支持的技术。数据治理意味着设置适用于收集、存储、处理和处置数据的内部标准,即数据策略。它规定了谁可以访问哪些数据以及哪些数据应受治理。数据治理还涉及遵循行业协会、政府机构和其他利益相关者设定的外部标准。数据治理包含以下几方面内容口:a确保有效助力业务的决策机制和方向;b确保绩效和合规进行监督;C确保信息利益相关者的需要评估,以达成一致的企业目标,这些企业目标需要通过对信息资源的获取和管理实现。8 .什么是机器学习?机器学习(ML)是人工智能(Al)的一个分支,旨在构建能够根据所使用的数据进行学习或改进性能的系统。人工智能是一个宽泛的术语,指的是模仿人类智能的系统或机器。机器学习和人工智能这两个术语经常被相提并论,有时甚至互换使用,但它们的含义并不相同。其中一个重大区别是,所有的机器学习都是AL但不是所有的Al都是机器学习。如今,机器学习无处不在。当我们与银行交互、在线购物或使用社交媒体时,机器学习算法会发挥作用,让我们获得高效、顺畅和安全的体验。目前,机器学习及其相关技术正迅速发展,对于它的强大功能,我们只是略知一二而已。9 .什么是人工智能?人工智能的范围可以说很大、很泛,从表面上可以理解为机器的智能化,让机器像人一样能解决思考解决问题。其实人工智能核心技术包括很多的方面:推理、知识、规划、学习、交流、感知、移动和操作物体的能力等。可以说机器学习和深度学习都是人工智能这个大主题下的一部分吧,深度学习又可以归为机器学习的一部分。简而言之,机器学习和深度学习是人工智能的两个关键的技能,看人工智能的发展历史,人工智能三大研究内容:计算机模仿人类的思考,对环境的感知和动作的实现是人工智能的三大研究内容。即:人工智能>机器学习>深度学习。10.什么是接口(API)?我们去餐厅看着菜单点菜,点好菜后,服务员会根据你的菜单,给你上菜。其中点菜就是餐厅提供的一种服务,这个服务的输入是菜单名,输出就是做好的菜。小结:所以说APl就是给客户提供服务的一种方式,它还需要人参和出参。再举几个我们工作中的常见例子口: 例子1:微信开放平台给其他开发者提供了微信扫码登录的API,开发者只要调用这个API就可以实现扫码登录。这个API的入参是登记在微信开放平台的一个appid和密钥,出参则是用户的openid等信息。 例子2:腾讯云给其他开发者提供了发短信的API,开发者只要调用这个API就可以发短信。这个API的入参是用户的手机号码和短信内容,出参则是发短信。 例子3:这是最常见的例子。我们的后台会暴露很多API给到前端调用,也就是HTTP接口。比如说一个查询商品的接口,入参是商品名称,出参是商品详情。IL什么是SDK?SDK全称是软件开发包,常见的比如百度地图SDK、微信支付SDK等。SDK是软件开发商封装自己的一些基础服务后,对外提供的一种软件开发工具包。目的在于省去第三方应用开发者的开发成本,使用现成的软件能力来服务于自己的产品。例如:百度地图SDK,提供了完整的地图展示、导航、定位等功能。作为第三方开发者,只需要调用SDK里的接口来使用这些服务即可,不需要自己从头开始来开发这些功能,极大的降低了开发成本,而对于SDK厂商来说,扩展了自己的生态圈,也丰富了用户群。12 .什么是cookie?有什么用?Internetcookie是文本数据的集合,用于在您浏览网络时保存有关您的某些信息。Web浏览器使用这些数据来创建更简单的用户体验并提供分析信息,网站所有者可以使用这些信息来创建更好的营销活动,以及其他用途。13 .什么是IP地址?IP地址(InternetProtocolAddress)是指互联网协议地址,又译为网际协议地址。IP地址是IP协议提供的一种统一的地址格式,它为互联网上的每一个网络和每一台主机分配一个逻辑地址,以此来屏蔽物理地址的差异。14 .什么是域名和DNS?在网络的远古时代,最开始的时候,我们是通过ip地址来访问服务器的。比如61.135.169.125就是百度的官网地址之一,如果每个网址我们都用ip地址来记忆,那是相当麻烦了。域名比ip地址更好记忆,所以我们一般使用域名来记忆一个网址。当我们输入域名的时候,DNS会自动帮我们把域名转成ip地址,因为有了ip地址,才能找到服务器。举个例子:假设ip地址是电话号码,域名就是人名,那么DNS就是通讯录,当你想打电话给某个人时,输入人名,DNS就会从通讯录中找出电话号码来拨打。15 .什么是爬虫?简单来讲,爬虫就是一个探测机器,它的基本操作就是模拟人的行为去各个网站溜达,点点按钮,查查数据,或者把看到的信息背回来。就像一只虫子在一幢楼里不知疲倦地爬来爬去。你可以简单地想象:每个爬虫都是你的分身。就像孙悟空拔了一撮汗毛,吹出一堆猴子一样。你每天使用的百度,其实就是利用了这种爬虫技术:每天放出无数爬虫到各个网站,把他们的信息抓回来,然后化好淡妆排着小队等你来检索。抢票软件,就相当于撒出去无数个分身,每一个分身都帮助你不断刷新12306网站的火车余票。一旦发现有票,就马上拍下来,然后对你喊:土豪快来付款。16 .什么是程序、进程和线程?程序是指令和数据的有序集合,是一个静态概念。进程(Process)是计算机中的程序关于某数据集合上的一次运行活动,是系统进行资源分配和调度的基本单位,是操作系统结构的基础。线程(Thread)是程序执行流的最小单元。线程是进程中的一个实体,是被系统独立调度和分派的基本单位。17 .什么是同步、异步和回调?同步调用,即当程序1调用程序2时,程序1停下不动,直到程序2完成回到程序1来,程序1才继续执行下去。异步调用,即当程序1调用程序2时,程序1径自继续自己的下一个动作,不受程序2的影响。回调(callback)和异步调用关系密切,通常使用回调来实现异步消息的注册。18 .什么是流(stream)?在C+、JaVa等编程语言中,流是指用来从另一个地方不间断地获取数据。19 .什么是缓存系统?一般分为两级,一级缓存也叫内存缓存,存取速度更快,程序退出数据就消失,不可一直保留,是一种以空间换时间的程序设计;二级缓存也叫硬盘缓存,容量大一点,速度慢一点,程序下次启动时候,依然可以使用。在一二级缓存超过某个阈值时,一般会使用LRU(LeastRecentlyUsed)算法进行淘汰。20 .什么是撞库攻击?通过收集互联网已泄露的用户和密码信息,生成对应的字典表,尝试批量登陆其他网站后,得到一系列可以登录的用户。21 .什么是TCPZlP协议?即TCP/IP协议族,TCP(传输控制协议)和IP(网际协议)为该家族中最早通过的标准。协议族可以分为四层:最上面的是应用层了,如http,ftp等协议;第二层是传输层,TCP和UDP协议在这个层次;第三层是网络层,IP协议就这一层,它负责对数据加上IP地址和其他的数据以确定传输的目标;第四层是数据链路层,这个层次为待传送的数据加入一个以太网协议头,并进行CRC编码,为最后的数据传输做准备。22 .什么是HTTPS?HyperTextTransferProtocoloverSecureSocketLayer(超文本传输安全协议,简单来讲即是HTTP的安全版,在HTTP下加入SSL层,广泛用于万维网上安全敏感的通讯,例如交易支付方面。23 .什么是URL?即统一资源定位符,对可以从互联网上得到的资源的位置和访问方法的一种简洁的表示,是互联网上标准资源的地址。可以分解为:协议(如http:/)+主机名(如http)+路径和文件名(如a20160221)+参数(如?a=l&b=2,目的是带上一些本地信息给服务器)+端口号。24 .什么是URLScheme?苹果给出的一个可以让app相互之间可以跳转的协议。25 .什么是敏捷式开发和瀑布式开发?敏捷开发以用户的需求进化为核心,采用迭代、循序渐进的方法进行软件开发。在敏捷开发中,把一个大项目分为多个相互联系,但也可独立运行的小项目,并分别完成,在此过程中软件一直处于可使用状态。瀑布式是最典型的预见性的方法,严格遵循预先计划的需求、分析、设计、编码、测试的步骤顺序进行,要到后期才能看到产品的样子。26 .什么是栈和队列?栈是一端受限,一段允许进行操作的线性表,遵循先进后出。队列也是一种特殊的线性表。不同于栈所服从的先进后出的原则,队列的原则是先进先出。27 .什么是增量更新?传统做法下重新下载安装一个最新版的apk文件,比较耗流量,不利于用户体验。增量更新只下载当前叩P版本与最新版本的差异内容,然后与当前版本就行合并成最新版本再安装。28 .什么是外部标志?用来使用用户身份的标志,可以是用户名,手机号,邮箱等,每一个外部标识一定和一个内部标识相关联用以确定一个用户。需要注意的是,外部标识可能改变。如openjd,unionjdo29 .什么是内部标志?即产品中用于标识用户唯一性的标志,例如userjd,必须有,不可更改且唯一,用户一般接触不到内部标识。当一个内部标识建立后,用户所有的数据资产都会绑定到这个内部标识上。如userjd.appjdo30 .什么是系统调用?操作系统的主要功能就是管理计算机系统的各种硬件资源。应用程序需要使用硬件资源的时候,需要向操作系统进行申请,这种申请的接口,就被叫做系统调用。在近代操作系统中,为了安全考虑,操作系统与用户程序不是跑在一个级别的。操作系统拥有所有的权限,用户程序则是跑在操作系统提供的一个虚拟环境中。用户程序看到的内存地址并不是真正的物理内存地址,而是一个虚拟的地址空间。因此当我们调用malloc/new进行he叩分配的时候,并不是我们的线程直接杀入内核,去领一块内存,而是我们提交一个申领请求,等待操作系统按顺序处理申请,处理完了将结果放在处理盒子中,然后让我们叫号去领。31 .什么叫私有化部署?指的是把应用部署到自己的服务器上。私有化部署是saas产品常用的一种对外服务方式。举个例子:比如企业微信就有提供私有化部署服务。为了防止聊天记录泄露,一般企业会采用私有化部署的方式,这样就可以把聊天信息落入到自己的数据库。再比如神策SDK,如果企业数据敏感,或者担心第三方服务不稳定,会把上报数据服务部署到自己的服务器上。那么什么条件下可以使用私有化部署呢?a有定制化的场景;b数据敏感,担心数据泄漏;c担心第三方服务不稳定导致业务异常、企业的运维环境能满足私有化部署的条件,比如能轻松维护一个web服务、有mysql数据库、有redis服务等。32 .什么是SaaS?SaaS(软件即服务)SaaS平台通过互联网向用户提供软件,通常需要按月订阅。33 .什么是PaaS?PaaS(平台即服务)PaaS供应商通过Imernet提供硬件和软件工具,人们使用这些工具来开发应用程序。PaaS用户往往是开发人员。34 .什么是IaaS?IaaS(基础架构即服务)IaaS业务提供按需付费存储,网络和虚拟化等服务。IaaS为用户提供了基于云的本地基础结构替代品,因此企业可以避免对昂贵的现场资源进行投资。#SaaS与IaaS大多数企业使用SaaS和IaaS云计算服务模型的组合,并且许多企业也吸引开发人员使用PaaS创建应用程序。SaaS示例:钉钉,企业微信;PaaS示例:MicrosoftWindowsAzure,百度BAE、新浪SAE、京东云擎JAE;-IaaS示例:AWS,阿里云,腾讯云,华为云。35 .什么叫云原生(CloudNative)?云原生二微服务+DevOps+持续交付+容器化。36 .什么叫容器化?容器技术是云原生的核心技术,容器是一种相对于虚拟机来说更加轻量的虚拟化技术。能为我们提供一种可移植、可重用的方式来打包、分发和运行程序。容器的基本思想就是将需要执行的所有软件打包到一个可执行程序包。例如,将一个JaVa虚拟机、TomCat服务器以及应用程序本身打包进一个容器镜像。用户可以在基础设施环境中使用这个容器镜像启动容器并运行应用程序。37 .什么叫持续交付?持续交付就是不误时开发,不停机更新,是一种软件开发方法,它利用自动化来加快新代码的发布。在持续交付流程中,开发人员对应用所做的更改可通过自动化被推送至代码存储库或容器镜像仓库。38 .什么叫DevOps(Development&Operations,开发和运维)是软件开发人员和IT运维人员之间的合作过程,是一种工作环境、文化和实践的集合,目标是高效地自动执行软件交付和基础架构更改流程。开发和运维人员通过持续不断的沟通和协作,可以以一种标准化和自动化的方式快速、频繁且可靠地交付应用。39 .什么叫微服务?微服务就是一种软件架构,使用微服务架构可以将一个大型的应用程序按照功能模块拆分成多个独立自治的微服务,每个微服务仅仅实现一种功能,具有很明确的边界。40 .什么叫数据库?数据库是面向交易的处理系统(业务系统),它是针对具体业务在数据库联机的日常操作,通常对记录进行查询、修改。用户较为关心操作的响应时间、数据的安全性、完整性和并发支持的用户数等问题。传统的数据库系统作为数据管理的主要手段,主要用于操作型处理,也被称为联机事务处理OLTP(On-LineTransactionProcessing)o41 .什么叫数据仓库(DataWarehouse)?数据仓库,英文名称为DataWarehouse,可简写为DW或DWHo数据仓库顾名思义,是一个很大的数据存储集合,出于企业的分析性报告和决策支持目的而创建,对多样的业务数据进行筛选与整合。它为企业提供一定的BI(商业智能)能力,指导业务流程改进、监视时间、成本、质量以及控制。数据仓库将各个异构的数据源数据库的数据给统一管理起来,并且完成了质量较差的数据的剔除、格式转换,最终按照一种合理的建模方式来完成源数据组织形式的转变,以更好的支持到前端的可视化分析。数据仓库的输入方式是各种各样的数据源,最终的输出用于企业的数据分析、数据挖掘、数据报表等方向。数据仓库一般针对某些主题的历史数据进行分析,支持管理决策,又被称为联机分析处理OLAP(On-LineAnalyticalProcessing)o42 .什么叫数据湖(DataLake)?并无准确定义,但一个合格的数据湖应当:数据湖需要提供足够用的数据存储能力这个存储保存了一个企业/组织中的所有数据。数据湖可以存储海量的任意类型的数据包括结构化、半结构化和非结构化数据。数据湖中的数据是原始数据,是业务数据的完整副本。数据湖中的数据保持了他们在业务系统中原来的样子。数据湖需要具备完善的数据管理能力(完善的元数据)可以管理各类数据相关的要素,包括数据源、数据格式、连接信息、数据schema.权限管理等。数据湖需要具备多样化的分析能力包括但不限于批处理、流式计算、交互式分析以及机器学习;同时,还需要提供一定的任务调度和管理能力。数据湖需要具备完善的数据生命周期管理能力。不光需要存储原始数据,还需要能够保存各类分析处理的中间结果,并完整的记录数据的分析处理过程,能帮助用户完整详细追溯任意一条数据的产生过程。数据湖需要具备完善的数据获取和数据发布能力。数据湖需要能支撑各种各样的数据源,并能从相关的数据源中获取全量/增量数据;然后规范存储。数据湖能将数据分析处理的结果推送到合适的存储引擎中,满足不同的应用访问需求。对于大数据的支持,包括超大规模存储以及可扩展的大规模数据处理能力。数据湖为什么叫数据湖而不叫数据河或者数据海?一个有意思的回答是:"河强调的是流动性,海纳百川,河终究是要流入大海的,而企业级数据是需要长期沉淀的,因此叫湖"比叫河要贴切;同时,湖水天然是分层的,满足不同的生态系统要求,这与企业建设统一数据中心,存放管理数据的需求是一致的,热"数据在上层,方便应用随时使用;温数据、冷数据位于数据中心不同的存储介质中,达到数据存储容量与成本的平衡。不叫海的原因在于,海是无边无界的,而湖是有边界的,这个边界就是企业/组织的业务边界;因此数据湖需要更多的数据管理和权限管理能力。叫湖的另一个重要原因是数据湖是需要精细治理的,一个缺乏管控、缺乏治理的数据湖最终会退化为数据沼泽,从而使应用无法有效访问数据,使存于其中的数据失去价值。43 .高并发是什么情况?高并发指的是Web系统在短时问内遇到大量网络请求的情况。比如双11活动、春晚抢红包活动,短时间内用户访问量非常大。高并发会导致系统在这段时问内执行大量操作,比如对数据库的查询/存储。高并发可能会导致请求响应过慢,甚至系统崩溃。解决高并发的问题一般需要通过各个方面进行优化,包括增加服务节点、限制流量、降级非核心功、算法优化、数据库优化等方式。44 .工程师说的脚本是什么?脚本这个词在工程师口中出现的频率比较高。当需要对数据库进行批量处理时,工程师会说跑一个脚本统一处理一下;当需要查询某一数据报表时,工程师会说用一个脚本批量查询。脚本也是一种被计算机执行的程序,为什么叫脚本呢?可以把脚本理解成拍戏用的剧本,剧本里会按照角色及对白把要拍的戏清晰地列出来,导演和演员会严格按照剧本表演。脚本就是一种面向计算机的剧本,是一个可被计算机执行的文件,文件里是一系列计算机指令,这些指令会按照顺序被计算机解析并执行。45 .透传是什么意思?透传从字面上看是:透明无感知地传输数据的含义。举个例子:发短信功能(利用第三方服务腾讯云的发短信接口),当用户输入手机号码点击发送验证码时,先调用我们自己后台的发短信接口,然后我们后台调用腾讯云的发短信接口,把用户从前端传过来的手机号码再继续传给腾讯云接口。数据传递的链路是:前端-我们后台-腾讯云。后台没有对数据做任何修改就直接传给腾讯云的这个过程就是透传。46 .什么是中台?为了提高效率,减少相同产品功能的开发,需要一个中间的组织服务来为公司内多款产品提供公共资源,这个中间的组织就是中台。比如说公司内有一款电商产品和社区产品,他们都需要一个搜索推荐的功能,这时他们不需要从O开始重复开发了,只需要中台部门做个搜索推荐中台服务,后续的产品按照中台的标准接入这个搜索推荐功能就可以啦。但是中台也是有缺点的,比如说中台产品出现问题时,影响面是很大的,将影响到接入它的所有产品。一切以“以用户为中心的持续规模化创新为目的,将后台各式各样的资源转化为前台易于使用的能力,帮肋我们打赢这场以用户为中心的战争的平台,我们都可以称之为中台:业务中台提供重用服务例如用户中心,订单中心之类的开箱即用可重用能力,为战场提供了强大的后台炮火支援能力,随叫随到,威力强大;数据中台提供了数据分析能力帮助我们从数据中学习改进,调整方向,为战场提供了强大及时的雷达监测能力,帮助我们掌控战场;移动及算法中台提供了战场一线火力支援能力帮助我们提供更加个性化的服务,增强用户体验,为战场提供了陆军支援能力,随机应变,所向披靡;技术中台提供了自建系统部分的技术支撑能力帮助我们解决了基础设施,分布式数据库等底层技术问题,为前台特种兵提供了精良的武器装备;研发中台提供了自建系统部分的管理和技术实践支撑能力帮助我们快速搭建项目,管理进度,测试,持续集成,持续交付,是前台特种兵的训练基地及快速送达战场的机动运输部队;组织中台为我们的项目提供投资管理、风险管理、资源调度等,是战场的指挥部,战争的大脑,指挥前线,调度后方。所以,评判一个平台是否称得上中台,最终评判标准不是技术也不是长什么模样,最终还是得前台说了算,毕竟前台才是战争的关键,才是感受得到战场的残酷、看得见用户的那部分人。47 .什么是封装?我们可能经常会听到开发说把这个功能封装一下,提供给其他平台调用。某个功能实现之后,把实现细节隐藏起来,只提供些接口给外部调用,内部怎么实现的我们不需要关心,这就封装。生活中的例子:比如售卖多种口味的冰激凌机。这台机器是怎么实现冰激凌功能的,我们不需要知道,因为它已经把实现细节封装起来了。我们只需要按下开关,冰激凌就出来啦。工作中的例子:比如运营商提供的发短信功能,第三方只需要调用发短信接口就可以给手机发短信,至于里面是怎么实现的我们不需要关心,因为运营商己经把它封装起来了。48 .什么是APP的整包更新和热更新?app版本更新迭代分为整包更新和热更新。整包更新是整个app安装包需要重新下载安装,它通过应用市场来更新,整包的体积比较大,下载速度慢。热更新就是动态下发代码,当用户打开叩P时,通过网络下载升级包来直接更新,不需要发布新版本到应用市场。升级包的体积比较小,下载速度快。发布一个app新版本,要上架到应用市场是需要审核的。ios应用市场审核很严格而且审核需要一定的时间,android市场也一样,遇到一些节假日会往后延期。热更新的方式可以绕过应用市场的审核,所以对于紧急的bug修复以及实时性较强的功能发布(比如运营活动)比较适合。49 .什么是appH5小程序?app指的是在智能手机上面,基于手机操作系统运行的应用程序,类比电脑上的软件。这里的手机操作系统就是我们平时说的IOS系统、安卓系统。我们常说的原生指的其实就是nativeappoH5是基于浏览器来运行的,H5也就是html5,就是网页的意思。我们平时在浏览器打开一个网址,然后看到的页面就是H5啦。小程序是强依赖于某款app运行的应用,比如微信小程序、支付宝小程序,离开了某款叩P,小程序没法运行,除非提供运行该小程序需要的内核环境,比如微信开发者工具。他们有什么优缺点呢?原生app/nativeapp 优点:它的U体验比较好,因为我们只要在应用市场安装完,点开app不需要网络请求就可以直接展示,它还可以调用手机的很多硬件设备,比如麦克风、摄像头、蓝牙、GPS等,但是H5是不能直接调用的。 缺点:开发周期长,因为不同的手机操作系统需要独立开发,一般分为IOS和安卓两种版本开发。产品迭代慢,需要提交到应用市场审核。新版本不能同步更新老版本,解决线上bug周期长,因为解决完后还需要用户重新下载才能看到没有bug的新版本。H5 优点:比较灵活,开发周期短,更新迭代快,只需要发个版本,线上就能直接看到。 缺点:打开页面需要网络请求,U体验相比叩P差点,还要兼容较多的浏览器。/但呈序小程序是各大公司研究出来的一种新型应用。比如微信小程序、支付宝小程序、抖音小程序。 优点:用完即走,不需要下载安装。 缺点:不同的公司,小程序的开发框架不同,有一定的学习成本。50.什么是后端/后台/服务端/服务器?后端、后台、服务端其实都是同个概念,指的是部署在服务器的项目,也就是应用。比如公司的内部运营管理平台是一个应用,会把它部署在服务器上。可以理解为服务端。用户信息的存储和处理,核心业务逻辑的业务处理代码等等都会放在后端。因此,后端的稳健性和安全性要求会特别的高。服务器是什么?其实服务器就是计算机,也就是我们平常看到的电脑。但是它跟电脑还是有很多不同点的,它的性能特别好,配置很高,价格也很贵,而且不能断电,要保证线上服务能正常访问。服务器有什么用途呢?用来部署各种应用。比如说你公司有2个平台,那么他们可能都部署在同一台服务器上。其实我们平时的电脑也可以拿来当作服务器,但是性能不太行,而且自己电脑会随时断电,很多方面不符合要求。