滴滴出行-技术类岗位-面试经验

以下内容来自于应聘者回忆整理

很多同学都想得到滴滴出行的实习或者校招机会。那从过来人的角度谈谈,要通过滴滴出行的实习、校招面试,都有哪些经验和注意事项呢?今天就跟大家分享一下。

【一面】

1、自我介绍

2、神经网络初始每条边训练出来的参数权重如何初始化?

3、神经网络训练出来的是全局最优解吗?

神经网络可以拟合任意函数,神经网络可以做优化问题,但不一定能找到最优解。

4、LR 模型的好处,相对于其他的同类算法来说有什么好处?

逻辑回归模型 (Logistic regression,LR),又称对数几率模型。 由于逻辑回归模型简单,可解释强,易实现,广泛应用于机器学习、深度学习、推荐系统、广告预估、智能营销、金融风控、社会学、生物学、经济学等领域。

5、LR 逻辑回归是分类算法还是回归算法? 还了解其他的分类算法吗

逻辑回归(Logistic Regression, LR)是一种经典的分类算法,它是利用回归思想来进行分类操作的一种“融合”算法。

6、如果给了数据集和 label 的话? 在什么情况在用 LR 比较合适,或者说比其他的算法合适?

7、逻辑回归和线性回归的区别?

  • 线性回归和逻辑回归都是 广义线性回归模型的特例
  • 线性回归只能用于 回归问题 ,逻辑回归用于 分类问题 (可由二分类推广至多分类)
  • 线性回归无联系函数或不起作用,逻辑回归的联系函数是 对数几率函数 ,属于Sigmoid函数
  • 线性回归使用 最小二乘法 作为参数估计方法,逻辑回归使用 极大似然法 作为参数估计方法

8、算法-数据结构方面了解的多不多

在计算机科学中,数据结构(Data Structure)是计算机中存储、组织数据的方式。 为什么数据结构和算法经常放在一起讨论? 算法用来设计一种使用计算机来解决问题的方法。 设计高效的算法又是怎么来实现的? 在我们学习了计算机编程后,也要学习数据结构与算法这些基础内容。 我们经常会听到有人说起: 程序 = 数据结构 + 算法 ,当我们遇到一个问题,或有一个需求时,在设计程序来解决问题时,其中重要一步就是设计数据结构,数据结构在问题解决中主要用来: 它包括数据元素(D)、数据元素之间的逻辑关系(L)、逻辑关系在计算机中的存储结构(S)和所规定的操作(O)这四部分。 数据(Data):所有能够被计算机识别的符号集合。

9、对什么排序算法有自己比较深的见解

十大经典排序算法

算法概述、冒泡排序(Bubble Sort)、选择排序(Selection Sort)、插入排序(Insertion Sort)、希尔排序(Shell Sort)、归并排序(Merge Sort)、快速排序(Quick Sort)、堆排序(Heap Sort)、计数排序(Counting Sort)、桶排序(Bucket Sort)

10、如果说有一个长度为 m 的整数数组,有 m 个整数组成,每个数的取值范围都在 0 到 n3 之间(前 闭后开,整数间可能会有重合)

11、了解的线性时间排序有哪些?

计数排序, 基数排序, 桶排序.

12、C++的问题,类的虚继承主要解决的是什么问题,举个例子来实现虚继承。好处是什么?

虚继承是解决 C++ 多重继承 问题的一种手段,从不同途径继承来的同一基类,会在子类中存在多份拷贝。. 这将存在两个问题:第一,浪费存储空间;第二,存在二义性问题。. 针对这种情况,C++ 提供虚基类(virtual base class)的方法,使得在继承间接共同基类时只保留一份成员。. 方法如下:. class A { }; class B: virtual public A { }; class C: virtual public A { }; class D: public B, public C { }; 【注意】虚基类并不是在声明基类时声明的,而是在声明派生类时,指定继承方式时声明的。.

13、第一 次训练 LR 的结果有什么用?

14、了解其内部实现吗。

15、模型的原理,你怎样知道目前差在什么地方,如何诊断。怎么提升后面的指标,还 是真的有办法或者明确的迭代方向。

所谓原理模型的 综合 ,是指在 抽象化 和 理想化 的条件下,以反映对象的 特性 和 规律 的概念系统来描述对象的整体结构的一种综合模型。 比如,在化学理论中,对于综合完成一个认识分子整体的原理模型来说,必须从概念上明确:首先,分子是由哪些性质不同的原子或原子团和多少原子组成?其次,原子或原子团间以什么方式相互联系和相互作用?原子或原子团的空间排列顺序、方向、角度和距离如何?再次,分子在整体上属于什么结构式?把这些问题的基本概念弄清楚了,一个分子的整体结构的原理模型也就综合完成了。 下面,以CnH2n+2的烷烃系列来看,最简单的甲烷分子也决不是1个碳原子和4个氢原子的简单相加,而是一个具有复杂结构的整体。

16、如何判断一个模型是不是过拟合(假如没有 baseline 怎么办),交叉验证是 怎么做的。

17、滴滴的一个实际问题,有司机的轨迹信息,对于具体的订单来说怎么去精准的确定乘客在哪个位置上车的。

18、有没有看关于 Hadoop 等大数据方面的东西

Hadoop是一个由Apache基金会所开发的分布式系统基础架构, 是一个存储系统+计算框架的软件框架。主要解决海量数据存储与计算的问题,是大数据技术中的基石。Hadoop以一种可靠、高效、可伸缩的方式进行数据处理,用户可以在不了解分布式底层细节的情况下,开发分布式程序,用户可以轻松地在Hadoop上开发和运行处理海量数据的应用程序。

19、Spark 目前会用吗。

Spark是一个通用的分布式数据处理引擎。上面这句话听起来或许很抽象,我们一个词一个词的来解释

通用:通用指的是Spark可以做很多事情。刚刚我们提到过的,包括机器学习,数据流传输,交互分析,ETL,批处理,图计算等等等等都是Spark可以做到的。甚至可以说,你需要用数据实现的任何事情,你都可以用Spark试试看。

分布式:指的是Spark处理数据的能力是建立在许多机器上的,是可以和分布式的存储系统对接的,是可以做横向扩展的(简单点说就是电脑越多,能力越大)

引擎:所谓引擎,说的就是Spark自己不会存储数据,它就像实体的机械引擎一样,会将燃料(对Spark来说是数据)转化成使用者需要的那种形式——例如驱动汽车,再例如得到一个需要的目标结论。

20、对自己未来的规划是什么样的。

想要更多滴滴出行实习、校招的机会,请点击这里

  • 1、刺猬实习遵循行业规范,任何转载的稿件都会明确标注作者和来源
  • 2、刺猬实习的原创文章,请转载时务必注明"来源:刺猬实习",不尊重原创的行为刺猬实习或将追究责任
  • 3、作者投稿可能会经刺猬实习编辑修改或补充。

相关推荐