中级数据分析项目实战营
无论你是刚毕业,还是想转行做数据分析,项目经验的积累都是重大的考验:怎样花对时间精力,取到真”经”,让面试官无可挑剔?
数据分析真实项目实战强化营
Real Projects for Data Analysis:Powers Your Project xperiencesand Accelerates Your Career As An Intermediate Analyst
# 惧怕面试官项目细节追问和步步紧逼
# 学技术够苦,苦逼是狂搜瞎编项目经历
# 流行分析类工具/软件都在学,却至今没拿到Offer?
# 成为一名年薪$7-10万的数据分析师,真的难吗?
 
如果你找对方法,10周就足以达成!完全不需要烧脑、焦虑、练演技、靠运气!有了高水平的真经验,面试官没理由不爱你。这不是神话,DQ数据分析真实项目实战强化营,作为"神话级"的项目特训,让学员在10周内收获别人用3年才能积累下的优质项目经验,搞定面试和工作变得前所未有的容易~
 ♞ 课程简介:
作为DQ数据分析系列的进阶必修经典课,本课程通过不一样的项目实战方法,帮助对数据分析已有初步认识或经验的初/中级分析师,在短期内通过训练实现质的飞跃,获取真正实用、有效的项目工作经验,并成功扫除求职面试和晋升过程中由项目经验匮乏带来的各类障碍。
通过 10周 的培训,本课程创造了以"两奇"著称的效果:时间奇短、效果奇强。以2017年为例:
  • 在职学员经过培训后,年薪(税前)提升比率平均为27.6%,
  • 中级职位面试的成功比例平均提升了61.9%
课程周期:共10周,每周8小时(一年内有新班时免费循环听)
上课时间:周日 1:00~ 5:00pm;周一 6:00 ~ 8:00pm;周二 6:00 ~ 8:00pm
上课地点:250 Consumers Road, Suite 901, North York
其他形式:远程、录播视频
授课老师:DQ
优惠活动:本期正式学员将特别获赠两门技术课程:
1.专为数据分析设计的编程基础课:
- Python Basics for Analyst(10周,20小时)
2.数据分析师必修的IT课程:
- IT Toolbox for Analyst(5周,20小时)
该课程包含Java,SQL,Linux等语言/工具的知识和技能
  
♞课程适合对象:
本课程适合于转行,或者是对数据分析有一定了解的刚毕业的同学。具体来讲,适合于以下群体
  • 晋升群体:想增强在加拿大市场金融、保险、零售、咨询等行业的数据分析项目工作经验的初/中级分析师;
  • 转行、求职群体: 对数据分析有一定了解和基础,比如有EXCEL / VBA / SQL等工具的使用经验;
  • 对数据分析感兴趣的自学人士:比如在自学EXCEL / VBA /Access,SQL,SAS,Tableau, Python, R等软件,但欠缺实际项目经验的人群。
 
♞课程特点:
  ✱1.以一敌百的"有用"项目:拒绝"高大全"假大空"
目前市场上各种项目培训班参差不齐,其中不乏许多以次充好、还往往看起来特别有诱惑力的。学员本来就是因为缺乏经验所以需要训练,因而,即便那些所谓
Real Project项目事实上脱离工作实际、只有教学价值,报名者们也很难判断。只有学员的真实成长,能够检验项目培训的真实价值。
好的项目,尤其是值得花钱来学的好项目,应该具有以下特征:
  • 有真用:不管是面试时聊项目经验,还是升职后第一次接手全新的数据分析项目挑战,都能从项目训练获得的经验上得到启发;
  • 以一敌百:除了项目本身有价值,还要有衍生的无限可能,参与一个项目能学到一大类项目的处理经验;
  • 传授"关键":不仅训练学员成功完成任务,更要训练解决问题的思路与应变方法,从获取"鱼"真正过渡到"渔";
  • 让你简历中的每一个技能点都得到项目经验的佐证和升华。
✱2.项目培训的实质:不是项目,而是有价值的项目工作经验"!
绝大部分学员,并不知道,其实自己要的"经验", 并非一般意义之经验, 是除了项目本身的知识,其实还包括了工作内容、工作流程、工作环境、现实工作和沟通中可能遇到的问题、各类工具和模型的选择标准等等全方位的知识。因为,不管你是求职还是晋升,其实都是同一项工程--获取新的工作机会,而它,是一个系统工程,并不是单个要素就能左右的。
这也是为什么DQ项目培训能收效明显的原因,因为DQ项目强化营不同于其他的培训项目,每一个知识点都要MAP到技术流程上它是从整个系统上对学员进行提升和改造
>每一个知识点都是以面试问题的形式提出来
>每一个ASSIGNMENT,都是在真实工作环境下完成的
>每一个ASSIGNMENT,都要探讨用不同工具完成,让工具回归到应用级别
>每一个项目都是流程完整的项目,从客户背景,到技术选型,效能评测,。。。
>每一个项目都是文档齐备的项目,并非只是把CODE写完就完事了...
 
✱3. "真相帝"与"潜规则"
和DQ其他课程一样,上完这个项目营,你会知道DQ老师"真相帝"的名号非虚。关于行业、关于高薪、关于工作的现实、关于发展路径和预期,请听听DQ老师的大实话,再合理做判断 - 至于行业中的行业规范、"潜规则"、套路等,更是其他培训中少有涉及的
 
✱4.浓缩高效
有过经验的人都知道,课程的价值并不取决于持续时间的长短,而是内容。
DQ全系列培训都遵从一条原则:用最短的时间、最高效的方式和最有用的内容,让就业直接见到效果。时间短,不仅降低培训费用,减少时间精力的耗损,也能有效对抗大家身上普遍存在的"拖延症"
 
✱5.学习效果保障及后续支持
除了一年免费repeat之外,本课程还提供:
  • 课程视频:独家提供全程课程录像,供学员一年内无限次观看、复习
  • 咨询和交流:针对在学习、求职、跳槽过程中遇到的任何问题及时获得支持和指导;免费加入学习群、交流群,免费入场各类讲座或分享活动等。
 
♞主讲人简介:
Dayong Qu | 数据分析就业指导顶尖专家。专注于为北美市场培养数据分析人才,并帮助有志于从事数据分析行业的华人及留学生就业和发展。近20年来,历任多家著名企业的Resource Manager、Delivery Director、Head of PMO、北美上市公司VP等,目前从事Independent Consultant & Staffing工作,客户包括世界500强公司、加拿大五大银行等。

 

 ♞ 课程引论:DQ谈项目准备   

✱ Manager为啥喜欢问项目?他要知道什么?

技术过硬就能搞定面试? 就能拿到OFFER? 如果是这样,就不用面试了,直接考试算了, 大家谁的分数高,谁有工作!面试和考试最大区别是,Manager会问项目, 会根据你的项目延展出其他问题,在根据你的回答问新的问题。这样做当然是有原因的 ,你不理解是因为你不在他的位置上【 世界上的事情多是屁股决定脑袋】

❶ Analyst 不同于Programmer, 不是IT的职位,Hiring Manager 也不是搞IT的,他们更加看重的是Candidate解决问题的能力,是否有能力协调各方面的需求来完成Manager的要求, 用什么工具是次要的 ,了解Business 比Technology 更加重要。
❷ Manager 不见得了解技术细节, 也不认为技术细节重要,他们只关心你能否整体上把握项目,配合他们的需求,有什么解决不了的问题,知道找谁解决。
❸ 真正的工作中,Analyst 的核心技能是Project Management, Requirement Analysis, SQL, PYTHON, and Reporting Generation其他工具都可能发生变化。在这种情况下Hiring Manager 当然不会在意个别工具的运用,而是要看你是否在项目中能够把你的故事讲清楚。

✱ 我们如何谈项目?谈什么manager才满意?

面试中项目谈什么内容,可以商榷,一个原则是要谈对方听得懂的话,把对方一步步领进你的场景,让对方问出你设计好的问题,了解项目的尺度,要解决的问题,带来的价值,以及你在项目中的角色。最应该避免的是在对方还没有搞清楚状况的情况下,谈论过多的技术,因为你不知道你了解的技术对方是否感兴趣。

❶ 开场要谈项目背景,客户是谁,在哪个行业,SIZE有多大,目前OPERATION如何!
❷ 客户为什么要做这个项目,客户自己做了哪些准备工作,为什么要找我们来完成项目
❸ 客户的需求到底是什么?如何来评估项目实施是否成功?
❹我们提出的解决方案是什么,有哪些准备工作要先做,项目实施计划如何,团队都有哪些人, 用了多少时间,最后的提交产品是什么, 客户是否满意?

这些问题谈清楚之后,才能谈技术,问对方是否关心技术细节。对方可能不了解你用的技术,但对于你谈的Business, 对方可以完全了解, 进而对你的水平有一个全面的评估。

✱ 我们必须准备的典型项目

项目准备真的是个技术活,到底应该准备什么类型项目,细节准备到什么程度,技术选型有什么考量,如何与其他部门协调,数据从哪里来,报表送到哪里去,项目的流程如何管控,哪些部分自动,哪些部分手动….., 不是我怀疑大家能力高低,而是你根本没有这个能力准备,这里面细节太多,下面我给大家提些建议,供参考:

❶ 自己准备项目也好,参加培训也好,项目的文档一定要齐全,没有文档,学生根本没有能力复述项目,讲的内容都是七零八落的。文档至少要包含覆盖如下要点:
– Requirements and Design documents
– Project planning and control documents
– Technical Architecture Design documents
– Project Deployment and Integration documents

❷ 你可能认为理想的项目应该面面俱到,覆盖完整流程;但事实上,只有十分,十分,十分小的项目你才有机会从头做到尾,大部分情况我们只能做其中的一部分。为了节省精力,可以与不同的业务背景结合起来准备若干项目,每个有各自的重点:
– Data Source identification
– Exploratory Data Analysis and Data Visualization / Distribution
– Prepare Model set [Training, Validation and Test ]
– Design report template and Generate Report
– Integrate result into existing decisions support system

❸ 大部分培训出来的学生,除了数据分析,产生报表,对其他的工作要求一无所知。要知道,我们的工作不是孤立的,我们需要和IT交流去拿到数据,分析产生的结果为其他部门提供Support, 这些都需要做System Integration:
– Integration by Files | Flat and Delimited
– Integration by Databases
– Integration with SOA / Web Services

✱ 选择项目行业
在所有的因素中,重中之重是reasonably 选择项目。目前来讲的热点是银行,保险,零售方面的业务。在设计项目的时候,要结合上面的第二点, 同时要确保数据量要足够,至少要有几十万条数据,否则无法考量Performance. 下面是一些例子供大家参考:

❶ Insurance 方向是就业的一个主要方向,业务方面要了解Claim process, Loss evaluation…..有可能的话,项目应该包含EDA, Evaluate different Models, and make a prediction. 技术选型可以用Python, SAS, or other Analytic tools
❷ Finance方向的项目不大好做,小的公司做的比较多的是integration. 建议考虑建立System Integration 的项目,技术选型采用Web Service / SOA 的技术框架,业务方面可以考虑提供比较成型的服务如 Principle Component Analysis, or Portfolio Optimization
❸ Retail / CRM这一方向职位最多的. 有两个比较重要的方面需要注意,一个是对于客户消费行为的预测,可以考虑用RFM Model,另一方面比较大的需求是STORE级别的销售预测。技术方面,由于分析的任务不是特别难,要把精力放在REPORTING上, 比如Template的设计,Report Deployment, 以及Automate the reporting process

 ♞ 课程内容   

Customer Relationship Management | Project 1(12 hours):
It is well known that Retail CRM has become an underlying platform supporting proven business development strategies — such as channel communications, customer experience (CX) management, social media engagement, loyalty programs, precision marketing and mobility

Objective
– Store Level EDA
– Customer Lead Generation
– Pre/Post Campaign analysis
Technical Activities
– Python for ETL
– IO with Python
– Data Migration
– RFM to score customers


Insurance Loss Prediction | Project 2(12 hours):
To improve loss ratios through more effective pricing and marketing, insurance providers need a solution that gathers relevant claims data from every corner of the enterprise as well as third-party data sources to provide both claims propensity predictions and claim size predictions.
Objective
– understand the current state of the insurance landscape
– dealing with rising claim rates and high loss ratios, the need have never been greater – establish and maintain a complete view of insurers’ current and prospective policyholders.
Technical Activities
– EDA Analysis to know, visualize data
– Various Algorithms Performance Evaluation
– Python as the analytic tool
– Prepare data
– Reporting in PDF, and HTML formats

Buildup Recommendation Engine | Project 3(12 hours):
One of the secrets for amazon to protect its winning position is an effective recommendation system, which is the so-called Collaborative filtering system, a method of making automatic predictions (filtering) about the interests of a user by collecting preferences or taste information from (collaborating). In this project, we will iron the idea, and implement it with Python
Objective
– Prepare data in JSON format
– Build up recommendation engine for CSV online customers
Technical Activities
– Training pipeline
– Computing Similarity
– Collaborative filtering
– Using RE make recommendations

Digital Marketing with AWS and Spark | Project 4(12 hours):
Different user has its own journey with a company’s digital ads (from search, display, social etc. channels). Based on the user’s journey pattern which has already led them to become company A’s client through online ads, use Machine Learning model to predict other users who haven’t converted to company A’s client will get converted in the future or not.
Objective
– Build up ML model for digital marketing
– Introduction to Google Cloud env.
– Put Spark, ML, and Cloud together
Topics to be covered
– Extract small amount of data from the whole dataset to build ML model
– Google Cloud Platform, the service and the product useD in the course
– Use Google BigQuery to query dataset for building ML model
 
Data Visualization and Prediction with Python (20 hours):
Today’s data visualization tools go beyond the standard charts and graphs used in Excel spreadsheets, displaying data in more sophisticated ways such as infographics, dials and gauges, geographic maps, sparklines, heat maps, and detailed bar, pie and fever charts. The images may include interactive capabilities, enabling users to manipulate them or drill into the data for querying and analysis.
Objective
– Familiar with development env
– Typical graphic presentation with Python
– Prediction and simulation with Python
Topics to be covered
– Setup Linux development Env.
– Data structure with Numpy, Pandas, Dataframe
– Graphic package with Matplotlib
– Simulations
 
Predictive Models with Python (12 hours):
Build forecasting models with Python programming language using training data. Learning forecasting methods and models is indispensable for business or financial analysts in areas such as sales and financial forecasting, inventory optimization, demand and operations planning, and cash flow management. It is also essential in data science, applied statistics, operations research, economics, econometrics and quantitative finance. And it is necessary for any business forecasting related decision.

Objective
– Directed Models
– Undirected Models
Topics to be covered
– Logistic regression
– Confusion matrix
– Support vector machines
– Naïve bayes
– Decision Trees
– Random Forests
– K mean
– Affinity groups


 ♞ 课程时间表   
 
Data Visualization with Python
Week 1                     
[Sun] 1:00-5:00PM [Mon] 6:00-8:00PM
– Course Introduction
– Env. Setup
– Data analysis process
– SQL Review / Test
– Installing Linux
– Setup python dev. env.
[Tue] 6:00-8:00PM
– Web Data Scraping basics
– Scrap data behind login form
Week 2                     
[Sun] 1:00-5:00PM [Mon] 6:00PM-8:00PM
– Review on Python
– Numpy
– Regular Expression
– Vectorization
– Data visualization
– Matplotlib basics
[Tue] 6:00-8:00PM
– Components for Graphic plot area
– Real time data plot
Week 3                     
[Sun] 1:00-5:00PM
– Dataframe
– Time series
– Structured data
– I/O with files


Project 1- CRM in Retails Industry (12 hours):
Week 3         
[Mon] 6:00-8:00PM [Tue] 6:00-8:00PM
– CVS Project Intro.
– Setup Dev. Env
– SDLC
– Business Requirement
  Analysis
[Sun] 1:00-5:00PM
– Identify data sources
– Data Migration
– Data cleansing & merging
– Build up Customer Signature
Week 4         
[Mon] 6:00-8:00PM [Tue] 6:00-8:00PM
– Campaign
– CRM
– RFM with Excel
– RFM with SQL
Predictive Modeling with Python (12 hours):
Week 5         
[Sun] 1:00-5:00PM [Mon] 6:00-8:00PM
– EDA with Python
– EDA with Excel
– Seaborn
– Vincent
– Logistic regression
– Confusion matrix
[Tue] 6:00-8:00PM
– Support vector  machines
– Naïve bayes
Week 6         
[Sun] 1:00-5:00PM
– Decision Trees
– Random Forests
– K mean
– Affinity groups

Project 2 – Insurance Loss Prediction (12 hours):
Week 6                     
[Mon] 6:00-8:00PM [Tue] 6:00-8:00PM
– Folium for mapping
– Heat map
– EDA for house pricing
– EDA result interpretation
Week 7                     
[Sun] 1:00-5:00PM [Mon] 6:00-8:00PM
– Insurance Lost project
– Insurance claim process
– EDA for insurance lost
– EDA result interpretation
– Data preprocessing
– Data wrangling
[Tue] 6:00-8:00PM
– Build-up prediction model
– Training different models
Project 4 – Digital Marketing with Google Cloud (12 hours):
W8 [Sun] 1:00-5:00PM W9[Sun] 1:00-5:00PM
– Intro digital Marketing
– Setup project
  development Env.
– EDA and Resampling
– Model preliminary
  assessment
– Google Cloud
  Platform
– Google BigQuery
– Google Dataproc
W10[Sun] 1:00-5:00PM
– GCP compute engine, PySpark Setup
– Use Google BigQuery to query data set
– Accessing data in Pyspark
– Use SparkML to run model
Recommendation engine Project 3(12 hours):
Week 8         
[Mon] 6:00-8:00PM
– Concept of recommendation engine
– Preparing data
[Tue] 6:00-8:00PM
– EDA for Customer data
– Build up collaborative filtering RE
Week 9          
[Mon] 6:00-8:00PM
[Tue] 6:00-8:00PM
– Report / Summary
– Dashboard
– Python Html report
– Python Pdf report
– Python Excel report
Week 10       
[Mon] 6:00-8:00PM
– Web application with flask
– Jinja2 for report template
[Tue] 6:00-8:00PM
– Web services
– Deployment and Integration 
Project 4 – Digital Marketing with Google Cloud (12 hours):
W8 [Sun] 1:00-5:00PM
– Intro digital Marketing
– Setup project development Env.
– EDA and Resampling 
– Model preliminary assessment
W9[Sun] 1:00-5:00PM
– Google Cloud Platform
– Google BigQuery
– Google Dataproc
W10[Sun] 1:00-5:00PM
– GCP compute engine, PySpark Setup
– Use Google BigQuery to query dataset
– Accessing data in Pyspark
– Use SparkML to run ML model

关于DQ数据分析培训 

由数据分析教育名师DQ创立,专注于为北美市场培养数据分析人才,并帮助有志于从事数据分析行业的华人及留学生就业和发展的精准职业教育品牌。

 ♞ 关于DQ:

Dayong Qu | 曲达雍数据分析就业指导顶尖专家。近20年来历任多家著名企业的Resource Manager、Delivery Director、Head of PMO、北美上市公司VP等,目前从事Independent Consultant & Staffing工作,客户包括世界500强公司、加拿大五大银行等。

关注DQ:微信扫码,进行咨询或获取免费学习资源:

                                                                                                                                                                                                                                                                                                               

本页最后更新: | -- | 网站设计和虚拟主机服务 WECAN.ca CMS