`
文章列表

1121工作总结

编了在java中调用linux的程序   若要从文件读参数: cat 1.txt | ./ictcrawler -c 1 -t 1 -n 3 >logg 若要传参数: echo "abc" | ./ict -c 1 -t 1 -n 3 >logg   但由于 有“|”的存在,java是不支持管程的,所以runtime不可以用

1120工作总结

1.Java调用shell  Java语言以其跨平台性和简易性而著称,在Java里面的lang包里(java.lang.Runtime)提供了一个允许Java程序与该程序所运行的环境交互的接口,这就是Runtime类,在Runtime类里提供了获取当前运行环境的接口。其中的exec函数 ...

MapReduce优化

相信每个程序员在编程时都会问自己两个问题“我如何完成这个任务”,以及“怎么能让程序运行得更快”。同样,MapReduce计算模型的多次优化也是为了更好地解答这两个问题。 MapReduce计算模型的优化涉及了方方面面的内容,但是主要集中在两个方面:一是计算性能方面的优化;二是I/O操作方面的优化。这其中,又包含六个方面的内容。 1. 任务调度 任务调度是Hadoop中非常重要的一环,这个优化又涉及两个方面的内容。计算方面:Hadoop总会优先将任务分配给空闲的机器,使所有的任务能公平地分享系统资源。I/O方面:Hadoop会尽量将Map任务分配给InputSplit所在的机器,以减少网络 ...

工作总结1117

     今天工作还蛮顺利的,应该都搞定了,只是集群貌似任务过多跑不起来,明天早点来运行吧。      总结一下,转码方法。。       GB2312 public static String gb2312ToWord(String str) throws Exception { String result = ""; byte[] bytes = new byte[str.length() / 2]; for (int i = 0; i < bytes.length; i++) { byte high = Byte.parseBy ...

1114工作总结

    昨天因为数据格式       错误总结:    1、    <!--StartFragment --> Exception in thread "main" java.lang.StringIndexOutOfBoundsException: String index out of range: -1    at java.lang.String.substring(String.java:1958)    at java.lang.String.substring(String.java:1925)    at java.awt.TextA ...

1113工作总结

前辈建议我将执行命令放入shell脚本中,这样就不至于看着一堆mapreduce心烦。 好主意!于是 #!/bin/bashhadoop jar sel.jar org.day1111.Main /user/hive/warehouse/clickwise.db/nstat/dt=20141011/dp=nstat/ /user/clickwise/rainbow/shell>/home/clickwise/rainbow/log 2>& 1 用了个重定向     indexOf 方法返回一个整数值,指出 String 对象内子字符串的开始位置。如果没有找到子 ...

1112工作总结

 本想已经把map reducer编好了,可却没成想今天确实怂了一路。 原因是没有彻底搞懂各个字段····而且也没人告我hive中数据的字段长度和hdfs的字段长度是不同的,而且我的程序时按照昨天在hive表中数的长度计量的,而且分隔符是“/001”,不是“/t”·····所以结果一直为空。。囧   后来慌慌的问前辈为什么只有uid后面跟奇怪的符号··点开reducer才发现是传个空,幸好前辈人够好而且不会java··不然我一定会被鄙夷的   日后一定要先看数据再写代码。还是数据敏感度低吧。。不过好歹是弄好了 <!--StartFragment -->     ...
今天因为业务需求,需要在java中进行字符串的模糊匹配,由于要比较的对象长度不同,也没有固定的组成规则,收集到下列三个方法解决问题   方法一、    public int indexOf(String str)      返回指定子字符串在此字符串中第一次出现处的索引。返回的整数是     this.startsWith(str, k)为 true 的最小 k值。参数:str - 任意字符串。返回:如果字符串参数作为一个子字符串在此对象中出现,则返回第一个这种子字符串的第一个字符的索引;如果它不作为一个子字符串出现,则返回-1。    if(str1.indexOf("RO&quo ...

1111工作总结

       今天开始第一天上班,没有想象中那么可怕的~可能最重要的或许是表现的比较乖吧。。同事也很热情。         好吧,小结一下                1               ssh远程登陆时中文乱码的解决办法                              vi /etc/sysconfig/i18n                                (改其内容为:                                 LANG="zh_CN.UTF-8"                           ...
  写在前面的话,学Hive这么久了,发现目前国内还没有一本完整的介绍Hive的书籍,而且互联网上面的资料很乱,于是我决定写一些关于《Hive的那些事》序列文章,分享给大家。我会在接下来的时间整理有关Hive的资料,如果 ...
  这些都是比较有实用性的系统配置,收藏下,以备不时之需!以下是etc下重要配置文件解释:  1、/etc/hosts       #文件格式: IPaddress hostname aliases       #文件功能: 提供主机名到IP地址的对应关系,建议将自己经常 ...
Java多线程两种实现方式的比较 实现多线程的两种方式,一种是继承Thread类,一种是实现Runnable接口,有两个例子如下: 方式一: 方式二: 疑问: 为什么实现Runnable时,创建线程对象不能写成 " MyThread mt=new MyThread();"? 明白了,就是说采用实现Runnable的方式时,例子2中定义的MyThread类并没有采用extends表明继承了Thread类,因此要调用Thread类中才有的start()方法,必须先创建Thread类的对象,才能调用start()方法,而Thread mt = new ...
进本地的setting.xml中配置source,局部不对外开放 公司内部的maven库本地.m2下载资源如果没有本地的setting.xml配置的source公司内部的maven库远端的maven库 阿里 hadoop源码位置/home/zjq/.m2/repository/org/apache/hadoop/hadoop-core/1.2.1 mvn eclipse:eclipse 自动转换为eclipse工程mvn clean install清空mvn clean 用于编译dependencymodules用于解耦
hadoop hdfs常用命令   hadoop常用命令:  hadoop fs  查看Hadoop HDFS支持的所有命令    hadoop fs –ls  列出目录及文件信息    hadoop fs –lsr  循环列出目录、子目录及文件信息    hadoop fs –put test.txt /user/sunlightcs  将本地文 ...
http://blog.itpub.net/29500582/viewspace-1285066/   http://www.cnblogs.com/end/archive/2012/02/21/2360965.html
Global site tag (gtag.js) - Google Analytics