你写什么数据,结构化还是非结构化?
BAT上传的数据不多。
假如一个文件1G,网络IO速度是多少?
文件可以搞成分布式的,一个主服务器记录文件每段内容的长度和存储信息,还可以冗余
假设网络带宽无穷大,1G文件瞬间到达主服务器内存,然后可以分成 100快,并行存储。
写磁盘是独占模式,分成100快时间就是单台服务器的 100分之1,
还有一个算法, 第一次交互,客户端从主服务器得到控制信息,然后文件直接搞100个线程传到 100台从服务器 ,这里有啥难的?
对于结构化数据,oracle 12c 直接解决,那就更快了。
像天猫这样的网站,访问的客户是很多,但是这些数据之间没有什么耦合, 分布一下,服务器的数据也可以瞬时传到浏览器, 我前面有帖子说了,设计一个系统,先要把业务搞清楚,然后分析数据流,那些操作是独占的,那些操作是可以并发的,设计也不难啊, hadoop 里面的很多关键技术,我也可以写出c++版本的啊。
我自己公司设计的产品,在全国几百个客户用得也很稳定。
软件比硬件的复杂在乎业务多变,关键搞清楚业务; 底层硬件的难点在于性能,可靠,工艺等。
技术可以讨论的,你就没有做过什么产品嘛。
以前我们做设计,考虑很多硬件成本,网络速度,现在我们可以撇开这些, 侧重于软件可维护性。
C++,java 的可读性比较好, js 就更加简单了,还有其他一些语言,其实呢,万变不离宗,
无论什么,都离不开 算法和数据结构,时间(cpu,IO) ,空间(内存,外存,网络存储),并发和互斥。
这些都是独立于语言的。 |