客户分析项目需求说明书
XX科技股份 编制
目录
一、 功能需求 ........................................... 3 1. 数据生产 ......................................... 3 2. 数据采集/消费 ..................................... 3 3. 数据分析 ......................................... 4 4. 数据展示 ......................................... 5 二、 可用性需求 ......................................... 6 三、 运行环境需求 ....................................... 8 四、 性能需求 ........................................... 8
一、 功能需求
1. 数据生产
对于该模块的业务,即数据生产过程,一般并不会让你来进行操作,数据生产是一套完整且严密的体系,这样可以保证数据的安 全性。但是如果涉及到项目的一 体化方案的设计(数据的产生、存储、分析、展示),则清楚每一个环节是如何处理的,包括其中每个环境可能隐藏的问题;数据结构,数据内容可能出现的问题。
2. 数据采集/消费
数据采集模块(消费),在企业中你要清楚流式数据采集框架flume和kafka的定位是什么。我们在此需要将实时数据通过flume采集到kafka然后供给给hbase消费。
flume:cloudera公司研发 适合下游数据消费者不多的情况; 适合数据安 全性要求不高的操作; 适合与Hadoop生态圈对接的操作。 kafka:linkedin公司研发 适合数据下游消费众多的情况;
适合数据安 全性要求较高的操作(支持replication); 因此我们常用的一种模型是:
线上数据 --> flume --> kafka --> flume(根据情景增删该流程) --> HDFS
线上数据 --> flume --> kafka --> sparkstreing 实时流式处理
消费存储模块流程图:
3. 数据分析
我们的数据已经完整的采集到了HBase集群中,这次我们需要对采集到的数据进行分析,统计出我们想要的结果。注意,在分析的过程中,我们不一定会采取一个业务指标对应一个preduce-job的方式,如果情景允许,我们会采取一个preduce分析多个业务指标的方式来进行任务。
分析模块流程图:
业务指标:
a) 用户每天主叫通话个数统计,通话时间统计。 b) 用户每月通话记录统计,通话时间统计。 c)用户流量使用情况,近两月使用统计。 d)用户使用情况。 e)收入来源分配。
4. 数据展示
数据展示模块流程图:
二、 可用性需求
先进性 系统设计采用先进的体系结构和软硬件技术,满足目前以及将来相当一段时间对系统的需求。从而达到既满足现阶段工作对系统水平和能力的要求,推动计算机应用向阶段发展,又能够在今后数年内保持其技术的先进性和实用性 开源性 统建设的根本目的在于信息共享,因此在系统建设中采用的各项软、硬件技术和产品符合开源性原则,符合当前国际标准或者事实上的国际标准。 可靠性 对于信息系统来说,可靠性是指在一定的环境下、在给定的时间内,系统不发生故障的概率。衡量软件可靠性的方法包括正确执行操作所占的比例,在发现新缺陷之前系统运行的时间长度和缺陷出现的密度。根据如果发生故障对系统有多大的影响和对于的可靠性的费用是否合理,来定量的确定可靠性需求。 数据交换、业务集成和信息展现承受着大批量的关键性数据的流转、交换和存储,要充分考虑到可能出现的问题。应当提倡规范化程序设计,预防可靠性祸害。数据和系统的可靠性对一个应用系统是至关重要的,因此,把这一原则作为重要因素考虑。 安 全性 信息安 全是防止系统被非法入侵的能力,既属于技术问题又属于管理问题。涉及防止非法访问系统功能,这些访问包括查询、导出、导入、新增、修改、删除等操作,防止数据丢失,防止入侵和防止私人数据进入系统。 数据交换、业务集成和信息展现所处理、传送和管理的信息,可能涉及到不同部门和系统的秘密或敏感信息,此类信息处理和传递的任何环节如果出现漏洞,其损失将是巨大的。数据和访问通过特定的方法完全保护起来。用明确的术语陈述完整性的需求,如身份验证、用户特权级别、访问约束或者需要保护的数据。 一般的,如果黑客为非法入侵花费的代价高于得到的好处,那么认为这样的系统是安 全的。 三、 运行环境需求
产品部署
1、已安装“客户分析系统”,且系统能正常使用。(建议内存不少于128G,硬盘不少于50G)
2、集群部署: 数据采集/存储集群、数据分析集群 3、授权码
在系统安装完成以后,需对客户分析系统注册授权码才能正常使用。发送申请授权码邮件后,会收到对应的授权码,将该授权码填入授权码页面即可。
4、浏览器
火狐、谷歌(建议使用火狐浏览器) 5、分辨率
显示器的屏幕分辨率,建议设置为1280*960、1920*1080。 6、软件系统需求
支持位的centos系统,建议采用centos7.5。
四、 性能需求
(1)性能
系统查看页面响应时间不多于2秒。 查询统计操作的响应时间不多于5秒。
简单报表生成时间不多于10秒。 复杂报表生成时间不多于30秒。 (2)可靠性
系统支持一天24小时,一周七天,一年365天不间断运行。 系统在连续运行中因软件故障导致停机的次数一年不得超过4次,单次系统修 复时间不得超过1小时。
(3)扩展性
系统应灵活适应不断变化的应用需求,不至于因简单调整而导致得大量程序修改或推翻重来。
随着用户数的增长及功能应用的增长系统应该能够保持足够的稳定性,维持正常的运行。
为保 障系统具有的伸缩性,能够支持集群技术。 (4)易用性
系统支持多种客户端设备,并能够自适应不同终端的显示分辨率。 页面具有统一的风格、直观的示意、人性化的操作方式。 系统具有丰富的在线帮助和提示功能,方便用户操作。
因篇幅问题不能全部显示,请点此查看更多更全内容
Copyright © 2019- huatuo0.com 版权所有 湘ICP备2023021991号-1
违法及侵权请联系:TEL:199 1889 7713 E-MAIL:2724546146@qq.com
本站由北京市万商天勤律师事务所王兴未律师提供法律服务