我这有个csv格式的数据文件,像这样:
id,iplong,agent,partnerid,cid,cntr,timeat,category,referer
3036123,700371228,Nokia_2626,8jljr,8ke8p,ng,2012-02-23 00:00:00.0,es,
3036121,3673743995,NokiaC2-00,8iqzc,8gspj,in,2012-02-23 00:00:00.0,es,365wsqn3c1s0ko4c
3036115,2885218125,MAUI,8icfe,8gt1j,vn,2012-02-23 00:00:00.0,co,
3036116,3033932966,Nokia_E63,8in1t,8g236,th,2012-02-23 00:00:00.0,pp,2yfyym3c5wis4o4w
......
第一行是字段名,第二行开始是数据,有些行referer字段是空不用理。
问题出在时间戳的格式上:2012-02-23 00:00:00.0
末尾多了个.0导致格式不对,怎样批处理去掉末尾两位呢?别人说用java或c++编程写,但是我已经忘光了写不出,同学说用awk命令可以,我看了awk命令但是还是不懂怎么删掉多余两位,用别的方法也行,求指教谢谢。
怪我咯2017-04-17 14:27:32
不會寫awk,來一個perl的
#!/usr/bin/env perl
use utf8;
use strict;
use warnings;
foreach my $file (@ARGV) {
open (my $fh, '<', $file) or die "Can not open file $file : $!";
open (my $oh, '>', $file.".out") or die "Can not open file $file.out : $!";
while (my $line = <$fh>) {
$line =~ s/(\d*-\d*-\d* \d*:\d*:\d*)\.\d//;
print $oh $line;
}
close $fh;
close $oh;
}
來一個perl6的
#!/usr/bin/env perl6
use v6;
use MONKEY-SEE-NO-EVAL;
sub MAIN(Str :r(:$regex), Str :s(:$substr), Str :e(:$ext) = '.out', Int :i(:$ignore-line) = 0, *@files) {
for @files -> $file {
my $out = open $file ~ ".out", :w;
for $file.IO.lines.kv -> $index, $line is copy {
next if $index <= $ignore-line;
$line ~~ EVAL "s/" ~ $regex ~ "/" ~ $substr ~ "/";
$out.say: $line;
}
$out.close;
}
}
用法
./script.p6 -r='(\d*\-\d*\-\d*\s\d*\:\d*\:\d*)\.\d' -s='rrreee' *files