数据分析工作经验班--4周白天班
免费公开课:周六12:30 pm 
Data Analysis Real Project
Analysis 核心技术;
经典项目准备;
项目流程实施:

4周变身数据分析职场实力派


课程班:

每周一至周五9:30 am-2:30 pm


数据分析进阶篇
准备项目,走起!
     曲达雍

本文非学术性探讨,也不是讨论哪一种技术,工具,或者课题难度指数高。我只是想帮助那些想找到一份分析类工作的同学理清思路,定好方向,以及制定可行的实施计划。任何建议,邮件jobready123@gmail.com

Manager为啥喜欢问项目?他要知道什么?

技术过硬就能搞定面试?  就能拿到OFFER? 如果是这样,就不用面试了,直接考试算了大家谁的分数高,谁有工作!面试和考试最大区别是,Manager会问项目, 会根据你的项目延展出其他问题,在根据你的回答问新的问题。这样做当然是有原因的 ,你不理解是因为你不在他的位置上【 世界上的事情多是屁股决定脑袋】

❶ Analyst 不同于Programmer, 不是IT的职位,Hiring Manager 也不是搞IT的,他们更加看重的是Candidate解决问题的能力,是否有能力协调各方面的需求来完成Manager的要求, 用什么工具是次要的 ,了解Business Technology 更加重要。 ❷ Manager 不见得了解技术细节, 也不认为技术细节重要,他们只关心你能否整体上把握项目,配合他们的需求,有什么解决不了的问题,知道找谁解决。 ❸ 真正的工作中,Analyst 的核心技能是Project Management, Requirement Analysis, SQL, PYTHON, and Reporting Generation其他工具都可能发生变化。在这种情况下Hiring Manager 当然不会在意个别工具的运用,而是要看你是否在项目中能够把你的故事讲清楚

我们如何谈项目?谈什么manager才满意?

面试中项目谈什么内容,可以商榷,一个原则是要谈对方听得懂的话,把对方一步步领进你的场景,让对方问出你设计好的问题,了解项目的尺度,要解决的问题,带来的价值,以及你在项目中的角色。最应该避免的是在对方还没有搞清楚状况的情况下,谈论过多的技术,因为你不知道你了解的技术对方是否感兴趣。

❶ 开场要谈项目背景,客户是谁,在哪个行业,SIZE有多大,目前OPERATION如何!

❷ 客户为什么要做这个项目,客户自己做了哪些准备工作,为什么要找我们来完成项目

❸ 客户的需求到底是什么?如何来评估项目实施是否成功?

我们提出的解决方案是什么,有哪些准备工作要先做,项目实施计划如何,团队都有哪些人,

     用了多少时间,最后的提交产品是什么, 客户是否满意这些问题谈清楚之后,才能谈技术,问对方是否关心技术细节。对方可能不了解你用的技术,但对于你谈的Business, 对方可以完全了解, 进而对你的水平有一个全面的评估

那些年,我们必须要准备的典型项目          

项目准备真的是个技术活,到底应该准备什么类型项目,细节准备到什么程度,技术选型有什么考量,如何与其他部门协调,数据从哪里来,报表送到哪里去,项目的流程如何管控,哪些部分自动,哪些部分手动….., 不是我怀疑大家能力高低,而是你根本没有这个能力准备,这里面细节太多, 下面我给大家提些建议,供参考

❶ 自己准备项目也好,参加培训也好,项目的文档一定要齐全,没有文档,学生根本没有能力复述项目,讲的内容都是七零八落的。文档至少要包含覆盖如下要点

-          Requirements and Design documents

-          Project planning and control documents

-          Technical Architecture Design documents

-          Project Deployment and Integration documents

❷ 你可能认为理想的项目应该面面俱到,覆盖完整流程;但事实上,只有十分,十分,十分小的项目你才有机会从头做到尾,大部分情况我们只能做其中的一部分。为了节省精力,可以与不同的业务背景结合起来准备若干项目,每个有各自的重点

-          Data Source identification

-          Exploratory Data Analysis and Data Visualization / Distribution

-          Prepare Model set [Training, Validation and Test ]

-          Design report template and Generate Report

-          Integrate result into existing decisions support system

❸ 大部分培训出来的学生,除了数据分析,产生报表,对其他的工作要求一无所知。要知道,我们的工作不是孤立的,我们需要和IT交流去拿到数据,分析产生的结果为其他部门提供Support, 这些都需要做System Integration

-          Integration by Files | Flat and Delimited

-          Integration by Databases

-          Integration with SOA  / Web Services

❹ 在所有的因素中,重中之重是reasonably 选择项目。目前来讲的热点是银行,保险,零售方面的业务。在设计项目的时候,要结合上面的第二点, 同时要确保数据量要足够,至少要有几十万条数据,否则无法考量Performance. 下面是一些例子供大家参考

-          Insurance 方向是就业的一个主要方向,业务方面要了解Claim process, Loss evaluation…..有可能的话,项目应该包含EDA, Evaluate different Models, and make a prediction. 技术选型可以用Python, SAS, or other Analytic tools

-          Finance方向的项目不大好做,小的公司做的比较多的是integration. 建议考虑建立System Integration 的项目,技术选型采用Web Service / SOA 的技术框架,业务方面可以考虑提供比较成型的服务如 Principle Component Analysis, or Portfolio Optimization

-          Retail / CRM这一方向职位最多的有两个比较重要的方面需要注意,一个是对于客户消费行为的预测,可以考虑用RFM Model,另一方面比较大的需求是STORE级别的销售预测。技术方面,由于分析的任务不是特别难,要把精力放在REPORTING比如Template的设计,Report Deployment, 以及Automate the reporting process

Instructor: Dayong Qu, who has20 year’s extensive practice in Project Management, Business Intelligence, and Software outsourcing with companies from government agencies, financial institutions and public firms, currently takes a role of senior Director of Resource Manager in the company that provides souring solution for major financial institutions.


Insurance Loss Prediction Project 1(25 hours):

To improve loss ratios through more effective pricing and marketing, insurance providers need a solution that gathers relevant claims data from every corner of the enterprise as well as third-party data sources to provide both claims propensity predictions and claim size predictions.

·         Objective

o   Given the current state of the insurance landscape, carriers competing for customers, dealing with rising claim rates and high loss ratios, the need have never been greater for insurers to establish and maintain a complete view of their current and prospective policyholders.

·         Technical Activities

o   EDA Analysis to know, visualize data

o   Various Algorithms Performance Evaluation

o   Python as the analytic tool

o   Prepare data

o   Reporting in PDF, and HTML formats

Web Services Integration in Financial Analysis Project 2(25 hours):

It is imperative that financial institutions consider service-oriented architecture (SOA) as an alternative infrastructure for internal and external interfaces, given the resulting cost reductions associated with its deployment; combined with standardized protocols, this will result in increased interoperability among IT infrastructures.

·         Objective

o   Investment  PCA Analysis

o   Investment Portfolio Optimization

·         Technical Activities

o   Web Services Integration

o   XML/JSON file handling

o   Python under Linux OS

o   Report in Excel /Linux

CRM in Retails Industry Project 3(25 hours):

It is well known that Retail CRM has become an underlying platform supporting proven business development strategies — such as channel communications, customer experience (CX) management, social media engagement, loyalty programs, precision marketing and mobility

·         Objective

o   Store Level EDA

o   Customer Lead Generation

o   Pre/Post Campaign analysis

·         Technical Activities

o   SSIS for ETL

o   SSAS / Cube

o   SSRS for reporting

o   RFM to score customers

Data Visualization and Prediction with Python (25 hours):

·         Today's data visualization tools go beyond the standard charts and graphs used in Excel spreadsheets, displaying data in more sophisticated ways such as infographics, dials and gauges, geographic maps, sparklinesheat maps, and detailed barpie and fever charts. The images may include interactive capabilities, enabling users to manipulate them or drill into the data for querying and analysis.  

·         Objective

o   Familiar with development env

o   Typical graphic presentation with Python

o   Prediction and simulation with Python

·         Topics to be covered

o   Setup Linux development Env.

o   Data structure with Numpy, Pandas, Dataframe

o   Graphic package with Matplotlib

o   Math and statistics

o   Simulations

 

 

(更多资料和具体参加方法)

 
本页最后更新: | -- | 网站设计和虚拟主机服务 WECAN.ca CMS